AI 精选动态智能评分 76

AGENTS.md 在 Coding Agents 中真的有用吗？

来源: twitter关注列表

作者: meng shao (@shao__meng)

发布于: 2026-06-08

收录于: 2026-06-08

AI 推荐理由

这篇文章给出了双基准、三条件、四 Agent 的完整实证结果，并揭示了“文档越多不一定越好”和“自动生成 context file 可能增加成本但不增成功率”的反直觉结论，值得点开看方法设计与消融细节。

核心解读

一项论文做了大规模实证研究，评估仓库级上下文文件 AGENTS.md、CLAUDE.md 等对编码 Agent 的影响，使用了 SWE-bench Lite（300 个任务、11 个热门 Python 仓库）和新建的 AGENTBENCH（138 个任务、12 个已含开发者 context file 的冷门仓库）。研究比较了三种条件：无 context file、LLM 生成（各 Agent 的 /init 流程）、开发者手写；Agent/模型包括 Claude Code + Sonnet 4.5、Codex + GPT-5.2 / GPT-5.1 mini、Qwen Code + Qwen3-30B。结果显示，LLM 生成的 context file 在 8 组设置中有 5 组成功率下降，平均在 SWE-bench 上为 -0.5%、在 AGENTBENCH 上为 -2%；开发者手写平均提升 4%，但在 Claude Code 上甚至不如无文件。效率方面，无文件最便宜，LLM 生成使步数增加 2.45 或 3.92 步、成本上升 20% 或 23%，开发者手写也平均增加 3.34 步、最高上升 19%；轨迹分析还显示 context file 会让 Agent 更严格遵守测试、搜索、lint 等要求，GPT-5.2 推理 token 增加 14–22%。

#研究#智能体#技术

阅读原始全文