返回精选
AI 精选动态 智能评分 68

Effective harnesses for long-running agents

来源: Anthropic-engineering
发布于: 2025-11-26
收录于: 2026-05-21
AI 推荐理由
这篇文章的新增价值在于把“长上下文 agent”问题拆成初始化与增量推进两阶段,并给出了可直接复用的进度文件、初始提交和功能清单做法,适合做 agent 工作流设计参考。
核心解读
Anthropic 介绍了用于长运行 agent 的 harness 设计,目标是让 Claude Agent SDK 能在多个 context window 中持续推进任务。其内部方案分为两部分:第一轮由 initializer agent 搭建环境,创建 `init.sh`、`claude-progress.txt` 和初始 git commit;之后每轮由 coding agent 做增量推进并留下结构化更新。文中指出,单靠 compaction 不足以让像 Opus 4.5 这样的前沿 coding model 仅凭高层提示词(例如“build a clone of claude.ai”)稳定完成生产级 web app,主要失败模式包括一次性做太多、上下文耗尽导致任务中断,以及后续轮次误判项目已完成。Anthropic 还提到,他们在更新后的 Claude 4 prompting guide 中补充了多 context window workflows 的最佳实践,并给出了超过 200 项功能需求的 feature list 作为初始化阶段的一部分。
#智能体#开发者工具#产品更新