AI 精选动态智能评分 60

MiniMax-M3 原生多模态 MoE

来源: twitter关注列表

作者: MiniMax (official) (@MiniMax_AI)

发布于: 2026-06-12

收录于: 2026-06-12

AI 推荐理由

首次披露原生多模态 MoE 模型 MiniMax-M3 及其 MSA 在 1M 上下文下的 9×/15× 加速和 1/20 单 token 计算量。

核心解读

MiniMax 发布原生多模态 MoE 推理模型 MiniMax-M3，总参数约 428B，活跃参数约 23B，60 层，支持 1M 上下文的文本、图像、视频；相较前代 M2，其 MiniMax Sparse Attention 在 1M 上下文下实现 prefill 提速 9×、decode 提速 15×、单 token 计算量降至 1/20，并在 NVIDIA Blackwell、AMD MI350X/MI355X 上原生支持 MXFP8、H200 提供 bf16 版本；该模型已在 SGLang 中实现 Day-0 支持。

#模型发布#多模态

阅读原始全文