AI 精选动态
智能评分 72
AI 推荐理由
该方案直击当前 agentic RL 的核心瓶颈——训练与推理语义不一致,为高效、可复现的智能体训练提供了工程级优化路径。核心解读
Prime Intellect 推出 Renderers,通过分离推理服务与模板/消息处理逻辑,解决 RL 训练中因 token-message 转换导致的计算浪费问题,实测在主流开源模型上提升超 3 倍吞吐量。