AI 精选动态智能评分 68

Effective harnesses for long-running agents

来源: Anthropic-engineering

发布于: 2025-11-26

收录于: 2026-05-21

AI 推荐理由

这篇文章的新增价值在于把“长上下文 agent”问题拆成初始化与增量推进两阶段，并给出了可直接复用的进度文件、初始提交和功能清单做法，适合做 agent 工作流设计参考。

核心解读

Anthropic 介绍了用于长运行 agent 的 harness 设计，目标是让 Claude Agent SDK 能在多个 context window 中持续推进任务。其内部方案分为两部分：第一轮由 initializer agent 搭建环境，创建 `init.sh`、`claude-progress.txt` 和初始 git commit；之后每轮由 coding agent 做增量推进并留下结构化更新。文中指出，单靠 compaction 不足以让像 Opus 4.5 这样的前沿 coding model 仅凭高层提示词（例如“build a clone of claude.ai”）稳定完成生产级 web app，主要失败模式包括一次性做太多、上下文耗尽导致任务中断，以及后续轮次误判项目已完成。Anthropic 还提到，他们在更新后的 Claude 4 prompting guide 中补充了多 context window workflows 的最佳实践，并给出了超过 200 项功能需求的 feature list 作为初始化阶段的一部分。

#智能体#开发者工具#产品更新

阅读原始全文