返回精选
AI 精选动态 智能评分 66

Code as Agent Harness

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-05-25
收录于: 2026-05-25
AI 推荐理由
适合关注 agent 架构的人阅读,重点看其如何把 tests、logs、repositories 和 sandboxes 统一进同一工作流。
核心解读
Meta、Stanford 和 Illinois 的一篇综述论文提出,AI agents 在把 code 作为主要工作层时表现更好。作者指出,单纯的 LLM 更像文本预测器,长任务中容易丢失状态、掩盖错误,并把计划脆弱地转成动作;他们把围绕模型的系统称为 agent harness,包括工具、记忆、沙箱、检查和反馈回路。论文的核心观点是让 code 处于该 harness 的中心,因为 code 可以被运行、检查、保存、编辑和共享;在这个框架下,tests 充当传感器,repositories 充当记忆,logs 充当历史,sandboxes 充当边界。
#智能体#开发者工具#研究突破