AI 精选动态
智能评分 68
Harness design for long-running application development
AI 推荐理由
文章给出了从单代理到三代理、以及从 compaction 到 context reset 的具体设计取舍,适合关注长任务 agent 编排的人直接对照自己的 harness 方案。重点可结合 Claude Sonnet 4.5 的 context anxiety 结论,评估是否需要引入外部 evaluator 和状态交接机制。核心解读
Anthropic 的 Labs 成员 Prithvi Rajasekaran 介绍了用于长时间运行应用开发的 harness 设计。他将早先的 frontend design skill 和 long-running coding agent harness 继续推进,针对 Claude 在前端设计和无人干预构建完整应用时遇到的瓶颈,提出了受 GAN 启发的多智能体结构:generator 与 evaluator,并扩展为 planner、generator、evaluator 三个 agent 的架构。文中提到,在长任务中,Claude Sonnet 4.5 会出现明显的 context anxiety,单靠 compaction 不足以支撑强表现,因此需要 context reset;这种方式以更高的编排复杂度、token 开销和延迟为代价,换取多小时自主编码会话中的稳定执行。