- AI HOT 精选动态

AI 精选动态智能评分 75

来源: twitter关注列表

作者: Berryxia.AI (@berryxia)

发布于: 2026-05-11

收录于: 2026-05-11

AI 推荐理由

提供了开发者选择Coding Agent的关键数据维度（性能、成本、效率），且涉及行业主流模型与Harness组合，值得开发者参考。

核心解读

Artificial Analysis发布了Coding Agent Index，综合测评了150余个模型与Harness（如Cursor CLI、Claude Code等）的组合性能，涉及SWE-Bench-Pro-Hard-AA、Terminal-Bench v2和SWE-Atlas-QnA等三个真实编码基准；Opus 4.7在Cursor CLI上获61分领先，GPT-5.5和Claude Code组合亦得60分，开源模型GLM-5.1在Claude Code上获53分，是开源最高分；成本差异30倍、耗时差异7倍，Gemini 3.1 Pro在自家CLI上仅43分。

#智能体#性能评测#开发者工具

阅读原始全文