返回精选
AI 精选动态 智能评分 70

BitCPM4-CANN 开源

来源: twitter关注列表
作者: ModelScope (@ModelScope2022)
发布于: 2026-05-23
收录于: 2026-05-23
AI 推荐理由
值得关注其低比特训练而非事后量化的实现方式,以及在无需特殊 kernels 前提下实现的约 6 倍推理内存节省与较小训练开销,适合参考复现。
核心解读
BitCPM4-CANN 开源,采用 Apache 2.0 许可证,训练阶段就保持权重为 {-1, 0, 1} 的 1.58-bit ternary LLM,而不是训练后再量化。该系列提供 0.5B、1B、3B、8B 四个模型尺寸,并提供 GGUF 版本。官方称其在 1B/3B/8B 上保留了 full-precision MiniCPM4 的 95.7%~97.2% 性能,推理内存占用约降低 6 倍,训练开销仅增加 5%,且无需特殊 kernels。
#开源#模型发布#技术突破