返回精选
AI 精选动态 智能评分 69

MiniMax发布M3大模型

来源: twitter关注列表
作者: 歸藏(guizang.ai) (@op7418)
发布于: 2026-06-01
收录于: 2026-06-01
AI 推荐理由
MSA架构在超长上下文下实现了计算量降低至1/20,且首次在开源模型中结合三个前沿能力,值得开发者关注其技术实现细节。
核心解读
MiniMax发布了大版本号模型升级MiniMax M3,标配1M超长上下文,采用MSA稀疏注意力架构,从训练起融合原生多模态能力。在100万上下文下每token计算量只有上一代的约1/20,性能数据包括59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1、34.8% SWE-fficiency、28.8% KernelBench Hard和74.2% MCP Atlas。
#模型发布#技术突破#大模型