AI 精选动态
智能评分 66
Code as Agent Harness
AI 推荐理由
适合关注 agent 架构的人阅读,重点看其如何把 tests、logs、repositories 和 sandboxes 统一进同一工作流。核心解读
Meta、Stanford 和 Illinois 的一篇综述论文提出,AI agents 在把 code 作为主要工作层时表现更好。作者指出,单纯的 LLM 更像文本预测器,长任务中容易丢失状态、掩盖错误,并把计划脆弱地转成动作;他们把围绕模型的系统称为 agent harness,包括工具、记忆、沙箱、检查和反馈回路。论文的核心观点是让 code 处于该 harness 的中心,因为 code 可以被运行、检查、保存、编辑和共享;在这个框架下,tests 充当传感器,repositories 充当记忆,logs 充当历史,sandboxes 充当边界。