AI 精选动态
智能评分 60
MiniMax-M3 原生多模态 MoE
AI 推荐理由
首次披露原生多模态 MoE 模型 MiniMax-M3 及其 MSA 在 1M 上下文下的 9×/15× 加速和 1/20 单 token 计算量。核心解读
MiniMax 发布原生多模态 MoE 推理模型 MiniMax-M3,总参数约 428B,活跃参数约 23B,60 层,支持 1M 上下文的文本、图像、视频;相较前代 M2,其 MiniMax Sparse Attention 在 1M 上下文下实现 prefill 提速 9×、decode 提速 15×、单 token 计算量降至 1/20,并在 NVIDIA Blackwell、AMD MI350X/MI355X 上原生支持 MXFP8、H200 提供 bf16 版本;该模型已在 SGLang 中实现 Day-0 支持。