AI 精选动态
智能评分 82
AI 推荐理由
这条内容对做代码模型、智能体训练和推理基础设施的人很有参考价值,尤其是定向反馈、合成任务设计和大模型分布式优化的实现细节。核心解读
Cursor 发布 Composer 2.5,宣称相较 Composer 2 在长任务持续推进、复杂指令遵循和协作自然度上都有明显提升,并且训练仍基于 Moonshot 的 Kimi K2.5。文章同时披露了三项关键训练改进:定向文本反馈强化学习、合成任务量提升到 25 倍,以及在 1T 模型上将优化器单步耗时压到 0.2 秒;这说明代码智能体模型正在从单纯跑分转向更强的长程协作与训练工程能力竞争。