AI 精选动态
智能评分 75
AI 推荐理由
该研究展示了通过测试时缩放和强化学习提升模型在极高难度科学推理任务上的突破性进展。核心解读
研究人员发布了一款 30B 参数规模的推理模型,通过统一的缩放方案,在物理和数学奥林匹克竞赛(IPhO、IMO/USAMO)中达到了金牌水平。