返回精选
AI 精选动态 智能评分 68

Harness design for long-running application development

来源: Anthropic-engineering
发布于: 2026-03-24
收录于: 2026-05-21
AI 推荐理由
文章给出了从单代理到三代理、以及从 compaction 到 context reset 的具体设计取舍,适合关注长任务 agent 编排的人直接对照自己的 harness 方案。重点可结合 Claude Sonnet 4.5 的 context anxiety 结论,评估是否需要引入外部 evaluator 和状态交接机制。
核心解读
Anthropic 的 Labs 成员 Prithvi Rajasekaran 介绍了用于长时间运行应用开发的 harness 设计。他将早先的 frontend design skill 和 long-running coding agent harness 继续推进,针对 Claude 在前端设计和无人干预构建完整应用时遇到的瓶颈,提出了受 GAN 启发的多智能体结构:generator 与 evaluator,并扩展为 planner、generator、evaluator 三个 agent 的架构。文中提到,在长任务中,Claude Sonnet 4.5 会出现明显的 context anxiety,单靠 compaction 不足以支撑强表现,因此需要 context reset;这种方式以更高的编排复杂度、token 开销和延迟为代价,换取多小时自主编码会话中的稳定执行。
#智能体#开发者工具#技术突破