AI 精选动态智能评分 65

New American lab focused on coding. Trained completely in-house on 30T tokens "by completing millio...

来源: twitter关注列表

作者: OpenRouter (@OpenRouter)

发布于: 2026-04-28

收录于: 2026-04-29

AI 推荐理由

该方法结合大规模代码执行反馈的强化学习技术，可能为AI在软件开发领域带来新突破。

核心解读

一家新的美国实验室通过在30T tokens数据上进行内部训练，开发了一种基于代码执行反馈的强化学习方法，旨在提升软件开发效率。

#强化学习#代码训练#AI开发

阅读原始全文