返回精选
AI 精选动态 智能评分 65

New American lab focused on coding. Trained completely in-house on 30T tokens "by completing millio...

来源: twitter关注列表
作者: OpenRouter (@OpenRouter)
发布于: 2026-04-28
收录于: 2026-04-29
AI 推荐理由
该方法结合大规模代码执行反馈的强化学习技术,可能为AI在软件开发领域带来新突破。
核心解读
一家新的美国实验室通过在30T tokens数据上进行内部训练,开发了一种基于代码执行反馈的强化学习方法,旨在提升软件开发效率。
#强化学习#代码训练#AI开发