AI 精选动态
智能评分 68
Effective harnesses for long-running agents
AI 推荐理由
这篇文章的新增价值在于把“长上下文 agent”问题拆成初始化与增量推进两阶段,并给出了可直接复用的进度文件、初始提交和功能清单做法,适合做 agent 工作流设计参考。核心解读
Anthropic 介绍了用于长运行 agent 的 harness 设计,目标是让 Claude Agent SDK 能在多个 context window 中持续推进任务。其内部方案分为两部分:第一轮由 initializer agent 搭建环境,创建 `init.sh`、`claude-progress.txt` 和初始 git commit;之后每轮由 coding agent 做增量推进并留下结构化更新。文中指出,单靠 compaction 不足以让像 Opus 4.5 这样的前沿 coding model 仅凭高层提示词(例如“build a clone of claude.ai”)稳定完成生产级 web app,主要失败模式包括一次性做太多、上下文耗尽导致任务中断,以及后续轮次误判项目已完成。Anthropic 还提到,他们在更新后的 Claude 4 prompting guide 中补充了多 context window workflows 的最佳实践,并给出了超过 200 项功能需求的 feature list 作为初始化阶段的一部分。