AI 精选动态智能评分 68

Harness design for long-running application development

来源: Anthropic-engineering

发布于: 2026-03-24

收录于: 2026-05-21

AI 推荐理由

文章给出了从单代理到三代理、以及从 compaction 到 context reset 的具体设计取舍，适合关注长任务 agent 编排的人直接对照自己的 harness 方案。重点可结合 Claude Sonnet 4.5 的 context anxiety 结论，评估是否需要引入外部 evaluator 和状态交接机制。

核心解读

Anthropic 的 Labs 成员 Prithvi Rajasekaran 介绍了用于长时间运行应用开发的 harness 设计。他将早先的 frontend design skill 和 long-running coding agent harness 继续推进，针对 Claude 在前端设计和无人干预构建完整应用时遇到的瓶颈，提出了受 GAN 启发的多智能体结构：generator 与 evaluator，并扩展为 planner、generator、evaluator 三个 agent 的架构。文中提到，在长任务中，Claude Sonnet 4.5 会出现明显的 context anxiety，单靠 compaction 不足以支撑强表现，因此需要 context reset；这种方式以更高的编排复杂度、token 开销和延迟为代价，换取多小时自主编码会话中的稳定执行。

#智能体#开发者工具#技术突破

阅读原始全文