返回精选
AI 精选动态 智能评分 77

Cohere 发布 North Mini Code

来源: twitter关注列表
作者: meng shao (@shao__meng)
发布于: 2026-06-10
收录于: 2026-06-10
AI 推荐理由
它不仅给出完整训练与评测链路,还公开了 256K/64K 上下文、MoE 激活方式、RLVR 方案和多基准结果,适合关注开源编程模型与 Agent 训练范式的人直接阅读原文。
核心解读
Cohere 发布首个开源编程模型 North Mini Code,定位为面向 Agent 编程的小参数高效率模型,采用 MoE 架构,标称规模为 30B/3B,包含 128 个专家、每个 token 激活 8 个专家,支持 256K 输入和 64K 输出上下文,最低运行硬件为 1× H100(FP8)。该模型采用三阶段后训练:两阶段级联 SFT 与 RLVR,其中 SFT 数据包含 7 万+ 可验证任务、约 5000 个仓库,二阶段约 4.5B token,RL 使用 CISPO,并在 Terminal(ReAct + bash)与 SWE-Agent 双环境联合训练。官方给出的结果包括:SWE-Bench Verified pass@10 为 80.2%,Terminal-Bench v2 pass@10 为 55.1%,RL 后 Terminal pass@1 提升 7.9%,SWE pass@1 提升 3.0%;在 OpenCode 评估上约提升 10%,mini-SWE-Agent 上 pass@1 达 61.0%。
#开源#模型发布#开发者工具