AI 精选动态智能评分 68

MiniMax M3 直播要点

来源: twitter关注列表

作者: MiniMax (official) (@MiniMax_AI)

发布于: 2026-06-02

收录于: 2026-06-03

AI 推荐理由

建议重点看原文和直播回放，重点关注 MSA 的 KV cache 处理方式与 1M 长上下文推理效率的实现细节。

核心解读

MiniMax 团队在与 Together AI 的直播中介绍了 M3，并称 Together AI 正在为其推理提供支持。M3 采用 MSA（MiniMax Sparse Attention），与 CSA/HCA 不同，它保留真实未压缩的 KV cache，并通过小规模 top-K 做 block-level selection，使 1M context window 可用；团队称上一代模型中约 30% 的 per-decode wall-clock time 消耗在 attention kernel，而 MSA 将这一比例降到约 5%。团队还表示，M3 原生支持图像和视频输入，能够处理长时程 agentic 任务、操作桌面电脑，在游戏开发和 Minecraft 风格构建、Unity 相关任务上表现良好；它也能在 vision-coding 任务中生成网站或 SVG、浏览并检查自身渲染结果再迭代。

#模型发布#多模态#技术突破

阅读原始全文