AI 精选动态智能评分 79

Cursor Composer 2.5

来源: twitter关注列表

作者: Artificial Analysis (@ArtificialAnlys)

发布于: 2026-05-21

收录于: 2026-05-21

AI 推荐理由

可重点看其在编码代理基准上的成本-性能帕累托位置，以及与 Cursor/Claude Code/Codex 不同执行环境下的对比数据，适合评估是否替换现有 coding agent。

核心解读

Cursor 发布了 Composer 2.5，并在 Artificial Analysis 的 Coding Agent Index 中获得 62 分，较 Composer 2 提升 14 分（48 分），排名第三，仅次于 Claude Opus 4.7（max）在 Claude Code 中的 66 分和 GPT-5.5（xhigh reasoning）在 Codex 中的 65 分。该模型在 Cursor CLI 中对 SWE-Bench-Pro-Hard-AA 提升 35 分至 47%（12%→47%），Terminal-Bench v2 提升 2 分至 66%（64%→66%），SWE-Atlas-QnA 提升 3 分至 72%（69%→72%）；其中在 SWE-Bench-Pro-Hard-AA 上的 47% 结果与 Claude Opus 4.7（max）在 Claude Code 中的表现可比。价格方面，Composer 2.5 standard 为每百万输入/输出 token 0.50/2.50 美元，Fast 为 3.00/15.00 美元；Artificial Analysis 还给出每任务成本分别为 0.07 美元和 0.44 美元，Fast 平均耗时 6.7 分钟，较 standard 的 9.3 分钟快约 39%，而与高效能对手相比成本约低 10 倍到 60 倍。

#模型发布#基准测试#开发者工具

阅读原始全文