返回精选
AI 精选动态 智能评分 60

NVIDIA 在 Hugging Face 发布优化版 GLM-5.2

来源: twitter关注列表
作者: AK (@_akhaliq)
发布于: 2026-06-25
收录于: 2026-06-26
AI 推荐理由
关键差异点在于 NVIDIA 将 GLM-5.2 量化至 NVFP4 并在 Blackwell GPU 上实现几乎无损的精度,值得点开原文查看具体量化效果和对比数据。
核心解读
NVIDIA 在 Hugging Face 发布优化版 GLM-5.2,该模型为 753B 参数的 MoE,支持 1M 上下文,并量化为 NVFP4 格式以在 Blackwell GPU 上运行,精度接近 FP8。
全文
AK (@_akhaliq) 转发了 DailyPapers (@HuggingPapers) 的帖子: NVIDIA just released an optimized GLM-5.2 on Hugging Face A 753B parameter MoE with 1M context, quantized to NVFP4 for Blackwell GPUs— nearly matching FP8 accuracy. https://t.co/tjtk0dVPEW ![photo](https://pbs.twimg.com/media/HLslqKWagAAG3xl.jpg)
#模型发布#技术#大模型