AI 精选动态智能评分 63

Language models need "sleep"

来源: twitter关注列表

作者: elvis (@omarsar0)

发布于: 2026-05-26

收录于: 2026-05-26

AI 推荐理由

这篇内容给出了一个可复现的 agent 记忆/计算分离方案，并在多个任务上展示了 sleep 时长与性能的关系，适合关注长上下文推理与低延迟 agent 架构的人点开原文。

核心解读

DAIR.AI 转引一篇关于长上下文 agent 的论文，提出让语言模型在运行中加入类似“睡眠”的离线巩固步骤：模型会周期性地对最近上下文做 N 次离线递归前向，然后把结果写入 state-space blocks 的 persistent fast weights，并清空 KV cache。这样可把额外计算挪到“睡眠”阶段，同时保持“清醒”时的预测低延迟。论文在 cellular automata、multi-hop graph retrieval 和一个数学推理任务上测试，结果显示更长的 sleep 时长会提升性能，且在需要更深层推理的样本上增益最大；作者指出这为长时间运行的 agents 提供了替代不断扩大 KV cache 的思路。

#智能体#研究突破#基础设施

阅读原始全文