返回精选
AI 精选动态 智能评分 71

BitCPM-CANN 开源

来源: twitter关注列表
作者: Rohan Paul (@rohanpaul_ai)
发布于: 2026-05-22
收录于: 2026-05-22
AI 推荐理由
这条信息的增量在于把端侧低比特训练、Ascend 910B 原生全流程、以及 11 个任务上 95%–97% 保留率同时打通,适合关注国产算力适配和低比特训练复现。
核心解读
ModelBest、Tsinghua Univ 和 OpenBMB 社区发布并开源了 BitCPM-CANN,这是全球首个完全在中国自研 AI 基础设施上训练的 1.58-bit 三值 LLM。该模型的全流程训练管线从量化算子、算法到完整框架均原生运行在 Huawei Ascend 910B NPU 上,开源版本覆盖 0.5B–8B 全模型家族。OpenBMB 表示,8B 模型可在手机、PC 和汽车等端侧设备上运行,1B–8B 模型相较全精度 MiniCPM4 在 11 个基准任务上保留了 95%–97% 的性能,且相较 BF16 约降低 6 倍内存占用。
#开源#大模型#基础设施