返回精选
AI 精选动态 智能评分 79

Cursor Composer 2.5

来源: twitter关注列表
作者: Artificial Analysis (@ArtificialAnlys)
发布于: 2026-05-21
收录于: 2026-05-21
AI 推荐理由
可重点看其在编码代理基准上的成本-性能帕累托位置,以及与 Cursor/Claude Code/Codex 不同执行环境下的对比数据,适合评估是否替换现有 coding agent。
核心解读
Cursor 发布了 Composer 2.5,并在 Artificial Analysis 的 Coding Agent Index 中获得 62 分,较 Composer 2 提升 14 分(48 分),排名第三,仅次于 Claude Opus 4.7(max)在 Claude Code 中的 66 分和 GPT-5.5(xhigh reasoning)在 Codex 中的 65 分。该模型在 Cursor CLI 中对 SWE-Bench-Pro-Hard-AA 提升 35 分至 47%(12%→47%),Terminal-Bench v2 提升 2 分至 66%(64%→66%),SWE-Atlas-QnA 提升 3 分至 72%(69%→72%);其中在 SWE-Bench-Pro-Hard-AA 上的 47% 结果与 Claude Opus 4.7(max)在 Claude Code 中的表现可比。价格方面,Composer 2.5 standard 为每百万输入/输出 token 0.50/2.50 美元,Fast 为 3.00/15.00 美元;Artificial Analysis 还给出每任务成本分别为 0.07 美元和 0.44 美元,Fast 平均耗时 6.7 分钟,较 standard 的 9.3 分钟快约 39%,而与高效能对手相比成本约低 10 倍到 60 倍。
#模型发布#基准测试#开发者工具