- AI HOT 精选动态

AI 精选动态智能评分 75

来源: twitter关注列表

作者: AK (@_akhaliq)

发布于: 2026-05-15

收录于: 2026-05-16

AI 推荐理由

该研究展示了通过测试时缩放和强化学习提升模型在极高难度科学推理任务上的突破性进展。

核心解读

研究人员发布了一款 30B 参数规模的推理模型，通过统一的缩放方案，在物理和数学奥林匹克竞赛（IPhO、IMO/USAMO）中达到了金牌水平。

#推理模型#数学推理#人工智能研究

阅读原始全文