返回精选
AI 精选动态 智能评分 67

Cursor Composer 2.5 基准

来源: twitter关注列表
作者: Artificial Analysis (@ArtificialAnlys)
发布于: 2026-05-22
收录于: 2026-05-22
AI 推荐理由
可重点查看完整基准表,判断其在成本、token 消耗和任务时延上的优势是否能迁移到你的代码代理工作流。
核心解读
Artificial Analysis 基于 API 定价和 Coding Agent Index 基准,比较了 Cursor Composer 2.5、Claude Code 中的 Opus 4.7(medium reasoning)以及 Codex 中的 GPT-5.5(medium)。结果显示,Composer 2.5 的每任务成本比 Opus 4.7 低 3–18 倍,比 GPT-5.5 低 5–32 倍;在该基准中,Composer 2.5 完成任务仅使用 160 万 token,而其他模型最高使用 570 万 token。时间表现上,所有配置的平均 Time per Task 约为 12 分钟,Composer 2.5 平均约 9 分钟,较平均值快约 1.3 倍,Composer 2.5 Fast 平均约 7 分钟,较平均值快约 1.8 倍。
#基准测试#开发者工具#智能体