AI 精选动态
智能评分 71
BitCPM-CANN 开源
AI 推荐理由
这条信息的增量在于把端侧低比特训练、Ascend 910B 原生全流程、以及 11 个任务上 95%–97% 保留率同时打通,适合关注国产算力适配和低比特训练复现。核心解读
ModelBest、Tsinghua Univ 和 OpenBMB 社区发布并开源了 BitCPM-CANN,这是全球首个完全在中国自研 AI 基础设施上训练的 1.58-bit 三值 LLM。该模型的全流程训练管线从量化算子、算法到完整框架均原生运行在 Huawei Ascend 910B NPU 上,开源版本覆盖 0.5B–8B 全模型家族。OpenBMB 表示,8B 模型可在手机、PC 和汽车等端侧设备上运行,1B–8B 模型相较全精度 MiniCPM4 在 11 个基准任务上保留了 95%–97% 的性能,且相较 BF16 约降低 6 倍内存占用。