AI 精选动态智能评分 67

Cursor Composer 2.5 基准

来源: twitter关注列表

作者: Artificial Analysis (@ArtificialAnlys)

发布于: 2026-05-22

收录于: 2026-05-22

AI 推荐理由

可重点查看完整基准表，判断其在成本、token 消耗和任务时延上的优势是否能迁移到你的代码代理工作流。

核心解读

Artificial Analysis 基于 API 定价和 Coding Agent Index 基准，比较了 Cursor Composer 2.5、Claude Code 中的 Opus 4.7（medium reasoning）以及 Codex 中的 GPT-5.5（medium）。结果显示，Composer 2.5 的每任务成本比 Opus 4.7 低 3–18 倍，比 GPT-5.5 低 5–32 倍；在该基准中，Composer 2.5 完成任务仅使用 160 万 token，而其他模型最高使用 570 万 token。时间表现上，所有配置的平均 Time per Task 约为 12 分钟，Composer 2.5 平均约 9 分钟，较平均值快约 1.3 倍，Composer 2.5 Fast 平均约 7 分钟，较平均值快约 1.8 倍。

#基准测试#开发者工具#智能体

阅读原始全文