返回精选
AI 精选动态 智能评分 73

Microsoft unveiled MAI-Thinking-1

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-06-02
收录于: 2026-06-03
AI 推荐理由
值得点开原文,重点看其从数据到评估的闭环训练流程,以及 35B active/1T MoE 架构在推理与编程基准上的具体表现。
核心解读
Microsoft 发布了 MAI-Thinking-1,并表示其已建立一条完整的内部流水线来反复训练更强的 reasoning 模型。该系统被 Microsoft 称为“hill-climbing machine”,会把数据、训练设置、奖励、安全测试和评估作为一个连贯流程持续优化。MAI-Thinking-1 使用 35B active parameters、1T 总参数的 mixture-of-experts 架构,在 AIME 2025 上得分 97.0%,在 LiveCodeBench v6 上得分 87.7%,在 SWE-Bench Pro 上得分 52.8%;其 base model 从头训练,使用了 30T 以人类生成内容为主的 tokens,且 Microsoft 说预训练阶段没有使用第三方模型蒸馏,之后再通过 reinforcement learning 训练数学推理、编程、工具使用、helpfulness 和安全能力。
#模型发布#大模型#基准测试