AI 精选动态
智能评分 77
Nemotron-Labs-Diffusion
AI 推荐理由
原文的新增点在于把三种解码范式统一到同一架构,并明确给出单用户最高 4× 真实吞吐提升;值得点开技术报告看其在不同并发水平下的效率边界和实现细节。核心解读
NVIDIA 发布 Nemotron-Labs-Diffusion,一个三模式语言模型家族,包含 3B、8B、14B 三个规模。该模型可仅通过切换 attention pattern/mask,在 Autoregressive、Diffusion 和 Self-Speculation 三种解码方式间切换,无需额外 draft 模型或架构改动。官方称其在单用户场景下真实吞吐最高可提升 4×,并已在 Hugging Face 以 open license 形式开放。