AI 精选动态
智能评分 77
Gemma 4 QAT 模型发布
AI 推荐理由
新增了面向本地端侧部署的量化训练方案、Q4_0 支持和移动端专用量化格式,且给出了 Gemma 4 E2B 约 1GB 的运行内存指标,适合关注端侧模型部署的人直接查看。核心解读
Google DeepMind 发布了新的 Gemma 4 QAT 模型,面向本地和端侧使用,重点提升效率。该版本采用 Quantization-Aware Training,在压缩时同步训练,以降低内存占用并尽量保留质量;同时支持常见的 Q4_0 格式,并新增了面向移动端的量化格式。Gemma 4 E2B 运行内存约为 1GB,文本版甚至可低于 1GB,使其更适合手机、笔记本、边缘设备和消费级 GPU 本地运行。