返回精选
AI 精选动态 智能评分 88

来源: twitter关注列表
作者: AYi (@AYi_AInotes)
发布于: 2026-05-18
收录于: 2026-05-18
AI 推荐理由
对做 coding agent、模型后训练和推理成本优化的从业者很有参考价值,可直接观察到垂直产品如何通过 RL 与合成数据把性能/成本曲线做穿。
核心解读
Cursor 发布 Composer 2.5,宣称这是其最强模型,擅长长时任务与复杂指令跟随,并在 CursorBench 3.1 上取得 63.2%,单任务成本接近 0 美元,Terminal-Bench 也追平 Opus 4.7。文章还指出其核心不是底座参数,而是把大量算力投入 RL、合成数据和 textual feedback RL,显示 agentic coding 正在从“拼底座”转向“拼训练后处理与行为校准”。
#模型发布#技术突破#开发者工具