AI 精选动态智能评分 65

科学进步可否预测

来源: twitter关注列表

作者: Sakana AI (@SakanaAILabs)

发布于: 2026-05-26

收录于: 2026-05-26

AI 推荐理由

这项工作的增量在于把“科学进步预测”具体化为可评测基准，并给出了对当前最先进模型能力边界的实证结论，值得关注其后续是否会成为相关研究的统一评测框架。

核心解读

Sakana AI 转发 hardmaru 的帖子，并引用其与 Oxford University、Stanford University、Allen AI 等研究者合作发表的研究。该研究提出评估 AI 科学预测能力的基准 CUSP，使用 4,760 件科学事件进行验证，结果显示当前最先进模型能识别有前景的研究方向，但难以预测这些方向是否会实现以及何时实现，且这一限制不能仅用训练数据量解释。Sakana AI 还提到其研究员山田祐太朗作为共同作者参与了该工作，并表示将继续开发包括 AI Scientist 在内、服务科学发展的 AI。

#研究突破#基准测试#AI模型

阅读原始全文