返回精选
AI 精选动态 智能评分 60

Anthropic上下文工程实践总结

来源: twitter关注列表
作者: Berryxia.AI (@berryxia)
发布于: 2026-06-27
收录于: 2026-06-27
AI 推荐理由
介绍了'做梦'机制及生产环境中的版本控制、权限管理等细节,是公开较少的技术实践,建议观看原视频获取完整内容。
核心解读
Anthropic的Lamis在AI DevCon 2026上讲解了上下文工程实践,从Claude MD文件、记忆工具、Skills到文件系统,并介绍了带外异步处理机制'做梦',用于跨会话模式识别和记忆优化。Anthropic已在生产中运行该套系统,观察到任务效率提升和成本降低。
全文
周末窝在家里,花半小时学习它吧! 别光刷短视频, 看下Anthropic的上下文管理的视频! 2026年AI DevCon上,Anthropic的Lamis做了一场关于上下文工程的演讲。 整场演讲浓缩了过去一年Anthropic在上下文管理上的所有实践,从最简单的方案到最前沿的架构。 从Claude MD文件开始。 一个纯Markdown文件,放在会话开头,告诉Agent代码库结构、组织信息、个人偏好。 效果出奇地好:Anthropic的原话是"unreasonably effective"。(效果惊人出奇的好) 但问题也明显:文件越来越长,上下文膨胀,管理困难。 第二步是记忆工具。 让Agent自主决定何时读取、何时写入、何时更新记忆。全部在带内完成,也就是在会话上下文中进行。 Anthropic发现,在这种场景下,自主性运作得非常好。Agent比人类更擅长判断什么值得记住。 第三步是Skills。 核心思想是渐进式披露。 Agent只看文件顶部几行前言,决定是否需要加载整个文件。 Lamis的比喻很精准:就像房间里有一个书架,每次有人跟我说话,我扫一眼书单,看有没有相关书籍,然后取下来读。 不需要提前把所有知识塞进上下文。 第四步是文件系统。 把记忆系统建模为普通文件系统,用Markdown文件填充,Agent用bash和grep搜索。 不需要花哨的向量数据库,不需要专门的工具——Agent本来就擅长操作文件系统。 但当这些方案扩展到生产环境,问题就来了。 多个Agent同时写入同一个记忆文件怎么办。一个Agent写入错误信息到组织级上下文,所有Agent都会受影响。记忆过时了怎么办。 有人通过提示词注入向记忆中写入恶意内容怎么办。 Anthropic给出的解决方案是四个原则:版本控制(能回滚)、并发控制(哈希校验)、权限管理(组织级只读、个人级可写)、可移植性(干净的API,跨系统访问)。 然后是最有意思的部分:做梦。 带内记忆有一个根本性局限:Agent既要完成任务,又要管理记忆,这是两个竞争性目标。 而且Agent只能看到当前会话的信息,无法识别跨会话的模式。 做梦是一个带外的异步处理过程。 它取一段时间内的所有会话记录,交给一个专门的Agent分析。 这个Agent查看记忆存储,识别模式,提出更改建议。比如:所有地理学生都答错了同一个问题:说明课程中缺少了某个主题。 所有数学考试的答案都用弧度制而不是角度制,说明工具配置有问题。 做梦本质上是一个批量处理的"校长",审查所有"学生"的作业,发现问题,调整"课程"。 它有自己的专用资源,不和任务执行竞争上下文。 Anthropic已经在生产中运行这套系统。 他们发现:Agent第二次执行任务时做得更好,成本降低(因为能一次性完成),延迟下降。 做梦的额外token消耗被任务本身的效率提升抵消了。 最后Lamis说了一句话值得记住:上下文工程是过去一年才真正发展起来的领域。 模型智能本身不会产生复利:它需要上下文来执行你交给它的具体任务。 而上下文工程的效果是倍增智能,即使模型本身变得更聪明,这个投资依然有价值。 https://video.twimg.com/amplify_video/2070876149769719808/vid/avc1/1922x1080/lUntAceoHKlqVcH6.mp4?tag=28
#AI#技术#行业动态