AI 精选动态
智能评分 75
AI 推荐理由
该框架展示了面向科学推理的 agentic 架构新范式,有可验证的 benchmark 提升数据,对 AI 在科研领域的应用和智能体任务分解方法具有重要参考价值。核心解读
David Louapre 发布了 physics-intern 智能体框架,通过将物理问题分解并调度多个专用智能体协同求解,将 Gemini 3.1 Pro 在 CritPt 基准上的准确率从 17.7% 提升至 31.4%,创下该最难 LLM 基准之一的新 SOTA。