AI 精选动态
智能评分 68
MiniMax M3 直播要点
AI 推荐理由
建议重点看原文和直播回放,重点关注 MSA 的 KV cache 处理方式与 1M 长上下文推理效率的实现细节。核心解读
MiniMax 团队在与 Together AI 的直播中介绍了 M3,并称 Together AI 正在为其推理提供支持。M3 采用 MSA(MiniMax Sparse Attention),与 CSA/HCA 不同,它保留真实未压缩的 KV cache,并通过小规模 top-K 做 block-level selection,使 1M context window 可用;团队称上一代模型中约 30% 的 per-decode wall-clock time 消耗在 attention kernel,而 MSA 将这一比例降到约 5%。团队还表示,M3 原生支持图像和视频输入,能够处理长时程 agentic 任务、操作桌面电脑,在游戏开发和 Minecraft 风格构建、Unity 相关任务上表现良好;它也能在 vision-coding 任务中生成网站或 SVG、浏览并检查自身渲染结果再迭代。