AI 精选动态
智能评分 67
Cursor Composer 2.5 基准
AI 推荐理由
可重点查看完整基准表,判断其在成本、token 消耗和任务时延上的优势是否能迁移到你的代码代理工作流。核心解读
Artificial Analysis 基于 API 定价和 Coding Agent Index 基准,比较了 Cursor Composer 2.5、Claude Code 中的 Opus 4.7(medium reasoning)以及 Codex 中的 GPT-5.5(medium)。结果显示,Composer 2.5 的每任务成本比 Opus 4.7 低 3–18 倍,比 GPT-5.5 低 5–32 倍;在该基准中,Composer 2.5 完成任务仅使用 160 万 token,而其他模型最高使用 570 万 token。时间表现上,所有配置的平均 Time per Task 约为 12 分钟,Composer 2.5 平均约 9 分钟,较平均值快约 1.3 倍,Composer 2.5 Fast 平均约 7 分钟,较平均值快约 1.8 倍。