返回精选
AI 精选动态 智能评分 60

MiniMax-M3 原生多模态 MoE

来源: twitter关注列表
作者: MiniMax (official) (@MiniMax_AI)
发布于: 2026-06-12
收录于: 2026-06-12
AI 推荐理由
首次披露原生多模态 MoE 模型 MiniMax-M3 及其 MSA 在 1M 上下文下的 9×/15× 加速和 1/20 单 token 计算量。
核心解读
MiniMax 发布原生多模态 MoE 推理模型 MiniMax-M3,总参数约 428B,活跃参数约 23B,60 层,支持 1M 上下文的文本、图像、视频;相较前代 M2,其 MiniMax Sparse Attention 在 1M 上下文下实现 prefill 提速 9×、decode 提速 15×、单 token 计算量降至 1/20,并在 NVIDIA Blackwell、AMD MI350X/MI355X 上原生支持 MXFP8、H200 提供 bf16 版本;该模型已在 SGLang 中实现 Day-0 支持。
#模型发布#多模态