返回精选
AI 精选动态 智能评分 76

AGENTS.md 在 Coding Agents 中真的有用吗?

来源: twitter关注列表
作者: meng shao (@shao__meng)
发布于: 2026-06-08
收录于: 2026-06-08
AI 推荐理由
这篇文章给出了双基准、三条件、四 Agent 的完整实证结果,并揭示了“文档越多不一定越好”和“自动生成 context file 可能增加成本但不增成功率”的反直觉结论,值得点开看方法设计与消融细节。
核心解读
一项论文做了大规模实证研究,评估仓库级上下文文件 AGENTS.md、CLAUDE.md 等对编码 Agent 的影响,使用了 SWE-bench Lite(300 个任务、11 个热门 Python 仓库)和新建的 AGENTBENCH(138 个任务、12 个已含开发者 context file 的冷门仓库)。研究比较了三种条件:无 context file、LLM 生成(各 Agent 的 /init 流程)、开发者手写;Agent/模型包括 Claude Code + Sonnet 4.5、Codex + GPT-5.2 / GPT-5.1 mini、Qwen Code + Qwen3-30B。结果显示,LLM 生成的 context file 在 8 组设置中有 5 组成功率下降,平均在 SWE-bench 上为 -0.5%、在 AGENTBENCH 上为 -2%;开发者手写平均提升 4%,但在 Claude Code 上甚至不如无文件。效率方面,无文件最便宜,LLM 生成使步数增加 2.45 或 3.92 步、成本上升 20% 或 23%,开发者手写也平均增加 3.34 步、最高上升 19%;轨迹分析还显示 context file 会让 Agent 更严格遵守测试、搜索、lint 等要求,GPT-5.2 推理 token 增加 14–22%。
#研究#智能体#技术