返回精选
AI 精选动态 智能评分 66

Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-05-28
收录于: 2026-05-28
AI 推荐理由
这篇论文把“agent 记忆”从单次正确性问题推进到生命周期可靠性问题,适合关注长会话、记忆系统和部署后退化评测的人直接看原文。
核心解读
德克萨斯大学团队提出论文《Your Agents Are Aging Too: Agent Lifespan Engineering for Deployed Systems》,指出 AI agents 在部署后即使底层模型不变,也会随着多轮会话、记忆压缩、事实更新和维护流程而逐步失去可靠性。论文提出基准 AgingBench,用于评估 agent 在跨多个会话中的持续可靠性,并分析 4 类老化问题:摘要遗漏关键信息、相似记忆混淆、更新事实过期、维护操作破坏记忆。文中举例包括药物剂量被弱化为“每天用药”、相似客户被混为一人、已取消订阅仍被视为有效、维护后日程消失。
#研究突破#智能体#基准测试