AI 精选动态
智能评分 65
New American lab focused on coding. Trained completely in-house on 30T tokens "by completing millio...
AI 推荐理由
该方法结合大规模代码执行反馈的强化学习技术,可能为AI在软件开发领域带来新突破。核心解读
一家新的美国实验室通过在30T tokens数据上进行内部训练,开发了一种基于代码执行反馈的强化学习方法,旨在提升软件开发效率。