AI 精选动态
智能评分 69
MiniMax发布M3大模型
AI 推荐理由
MSA架构在超长上下文下实现了计算量降低至1/20,且首次在开源模型中结合三个前沿能力,值得开发者关注其技术实现细节。核心解读
MiniMax发布了大版本号模型升级MiniMax M3,标配1M超长上下文,采用MSA稀疏注意力架构,从训练起融合原生多模态能力。在100万上下文下每token计算量只有上一代的约1/20,性能数据包括59.0% SWE-Bench Pro、66.0% Terminal Bench 2.1、34.8% SWE-fficiency、28.8% KernelBench Hard和74.2% MCP Atlas。