AI 精选动态
智能评分 60
Anthropic上下文工程实践总结
AI 推荐理由
介绍了'做梦'机制及生产环境中的版本控制、权限管理等细节,是公开较少的技术实践,建议观看原视频获取完整内容。核心解读
Anthropic的Lamis在AI DevCon 2026上讲解了上下文工程实践,从Claude MD文件、记忆工具、Skills到文件系统,并介绍了带外异步处理机制'做梦',用于跨会话模式识别和记忆优化。Anthropic已在生产中运行该套系统,观察到任务效率提升和成本降低。
全文
周末窝在家里,花半小时学习它吧!
别光刷短视频, 看下Anthropic的上下文管理的视频!
2026年AI DevCon上,Anthropic的Lamis做了一场关于上下文工程的演讲。
整场演讲浓缩了过去一年Anthropic在上下文管理上的所有实践,从最简单的方案到最前沿的架构。
从Claude MD文件开始。
一个纯Markdown文件,放在会话开头,告诉Agent代码库结构、组织信息、个人偏好。
效果出奇地好:Anthropic的原话是"unreasonably effective"。(效果惊人出奇的好)
但问题也明显:文件越来越长,上下文膨胀,管理困难。
第二步是记忆工具。
让Agent自主决定何时读取、何时写入、何时更新记忆。全部在带内完成,也就是在会话上下文中进行。
Anthropic发现,在这种场景下,自主性运作得非常好。Agent比人类更擅长判断什么值得记住。
第三步是Skills。
核心思想是渐进式披露。
Agent只看文件顶部几行前言,决定是否需要加载整个文件。
Lamis的比喻很精准:就像房间里有一个书架,每次有人跟我说话,我扫一眼书单,看有没有相关书籍,然后取下来读。
不需要提前把所有知识塞进上下文。
第四步是文件系统。
把记忆系统建模为普通文件系统,用Markdown文件填充,Agent用bash和grep搜索。
不需要花哨的向量数据库,不需要专门的工具——Agent本来就擅长操作文件系统。
但当这些方案扩展到生产环境,问题就来了。
多个Agent同时写入同一个记忆文件怎么办。一个Agent写入错误信息到组织级上下文,所有Agent都会受影响。记忆过时了怎么办。
有人通过提示词注入向记忆中写入恶意内容怎么办。
Anthropic给出的解决方案是四个原则:版本控制(能回滚)、并发控制(哈希校验)、权限管理(组织级只读、个人级可写)、可移植性(干净的API,跨系统访问)。
然后是最有意思的部分:做梦。
带内记忆有一个根本性局限:Agent既要完成任务,又要管理记忆,这是两个竞争性目标。
而且Agent只能看到当前会话的信息,无法识别跨会话的模式。
做梦是一个带外的异步处理过程。
它取一段时间内的所有会话记录,交给一个专门的Agent分析。
这个Agent查看记忆存储,识别模式,提出更改建议。比如:所有地理学生都答错了同一个问题:说明课程中缺少了某个主题。
所有数学考试的答案都用弧度制而不是角度制,说明工具配置有问题。
做梦本质上是一个批量处理的"校长",审查所有"学生"的作业,发现问题,调整"课程"。
它有自己的专用资源,不和任务执行竞争上下文。
Anthropic已经在生产中运行这套系统。
他们发现:Agent第二次执行任务时做得更好,成本降低(因为能一次性完成),延迟下降。
做梦的额外token消耗被任务本身的效率提升抵消了。
最后Lamis说了一句话值得记住:上下文工程是过去一年才真正发展起来的领域。
模型智能本身不会产生复利:它需要上下文来执行你交给它的具体任务。
而上下文工程的效果是倍增智能,即使模型本身变得更聪明,这个投资依然有价值。
https://video.twimg.com/amplify_video/2070876149769719808/vid/avc1/1922x1080/lUntAceoHKlqVcH6.mp4?tag=28