AI 精选动态
智能评分 60
NVIDIA 在 Hugging Face 发布优化版 GLM-5.2
AI 推荐理由
关键差异点在于 NVIDIA 将 GLM-5.2 量化至 NVFP4 并在 Blackwell GPU 上实现几乎无损的精度,值得点开原文查看具体量化效果和对比数据。核心解读
NVIDIA 在 Hugging Face 发布优化版 GLM-5.2,该模型为 753B 参数的 MoE,支持 1M 上下文,并量化为 NVFP4 格式以在 Blackwell GPU 上运行,精度接近 FP8。
全文
AK (@_akhaliq) 转发了 DailyPapers (@HuggingPapers) 的帖子:
NVIDIA just released an optimized GLM-5.2 on Hugging Face
A 753B parameter MoE with 1M context,
quantized to NVFP4 for Blackwell GPUs—
nearly matching FP8 accuracy. https://t.co/tjtk0dVPEW
