AI 精选动态智能评分 77

Gemma 4 QAT 模型发布

来源: twitter关注列表

作者: Chubby♨️ (@kimmonismus)

发布于: 2026-06-05

收录于: 2026-06-05

AI 推荐理由

新增了面向本地端侧部署的量化训练方案、Q4_0 支持和移动端专用量化格式，且给出了 Gemma 4 E2B 约 1GB 的运行内存指标，适合关注端侧模型部署的人直接查看。

核心解读

Google DeepMind 发布了新的 Gemma 4 QAT 模型，面向本地和端侧使用，重点提升效率。该版本采用 Quantization-Aware Training，在压缩时同步训练，以降低内存占用并尽量保留质量；同时支持常见的 Q4_0 格式，并新增了面向移动端的量化格式。Gemma 4 E2B 运行内存约为 1GB，文本版甚至可低于 1GB，使其更适合手机、笔记本、边缘设备和消费级 GPU 本地运行。

#模型发布#产品更新#基础设施

阅读原始全文