AI 精选动态智能评分 60

Unsloth 将 Kimi K2.7 Code 量化至 325GB 本地运行

来源: twitter关注列表

作者: Berryxia.AI (@berryxia)

发布于: 2026-06-15

收录于: 2026-06-15

AI 推荐理由

值得关注其动态量化方法，可在大模型本地部署中复现，尤其适合长程任务和 agent 工作流。

核心解读

Unsloth 通过动态 2bit 量化将 1 万亿参数的 Kimi K2.7 Code 模型压缩 48% 至 325GB，使其可在 330GB RAM/VRAM 本地运行，速度超过 40 tok/s，全精度需 610GB。该优化保留了关键层精度，使大型 coding 模型的本地闭环成为可能。

#开源#模型#技术