AI 精选动态
智能评分 88
AI 推荐理由
对做 coding agent、模型后训练和推理成本优化的从业者很有参考价值,可直接观察到垂直产品如何通过 RL 与合成数据把性能/成本曲线做穿。核心解读
Cursor 发布 Composer 2.5,宣称这是其最强模型,擅长长时任务与复杂指令跟随,并在 CursorBench 3.1 上取得 63.2%,单任务成本接近 0 美元,Terminal-Bench 也追平 Opus 4.7。文章还指出其核心不是底座参数,而是把大量算力投入 RL、合成数据和 textual feedback RL,显示 agentic coding 正在从“拼底座”转向“拼训练后处理与行为校准”。