- AI HOT 精选动态

AI 精选动态智能评分 65

来源: twitter关注列表

作者: Z.ai (@Zai_org)

发布于: 2026-05-11

收录于: 2026-05-12

AI 推荐理由

框架整合主流开源组件，显著提升大模型 RLHF 训练效率和可生产化，对开发者和平台建设者具有重要参考价值。

核心解读

Z.ai 转发了知乎前沿的帖子，介绍了全新开源强化学习训练框架 Slime，基于 SGLang、Megatron 与 Ray，实现训练与推理解耦、支持高并发、MoE 与多种并行方式，并提供灵活的资源调度和插件化定制。

#强化学习#开源框架#模型训练