返回精选
AI 精选动态 智能评分 65

科学进步可否预测

来源: twitter关注列表
作者: Sakana AI (@SakanaAILabs)
发布于: 2026-05-26
收录于: 2026-05-26
AI 推荐理由
这项工作的增量在于把“科学进步预测”具体化为可评测基准,并给出了对当前最先进模型能力边界的实证结论,值得关注其后续是否会成为相关研究的统一评测框架。
核心解读
Sakana AI 转发 hardmaru 的帖子,并引用其与 Oxford University、Stanford University、Allen AI 等研究者合作发表的研究。该研究提出评估 AI 科学预测能力的基准 CUSP,使用 4,760 件科学事件进行验证,结果显示当前最先进模型能识别有前景的研究方向,但难以预测这些方向是否会实现以及何时实现,且这一限制不能仅用训练数据量解释。Sakana AI 还提到其研究员山田祐太朗作为共同作者参与了该工作,并表示将继续开发包括 AI Scientist 在内、服务科学发展的 AI。
#研究突破#基准测试#AI模型