AI 精选动态
智能评分 61
Gemma 4 QAT 检查点上线
AI 推荐理由
可点开原文确认各尺寸模型的量化方案与端侧部署收益,判断是否适合直接用于移动端或边缘设备推理。核心解读
Google Gemma 在 Hugging Face 发布了 Gemma 4 Quantization-Aware Training(QAT)检查点,覆盖 Gemma 4 的所有模型尺寸及其 drafters。官方称这些模型已通过 QAT 优化,以降低内存需求并提升端侧性能。