- AI HOT 精选动态

AI 精选动态智能评分 66

来源: twitter关注列表

作者: ModelScope (@ModelScope2022)

发布于: 2026-05-18

收录于: 2026-05-18

AI 推荐理由

对做语音模型、多模态生成和应用集成的从业者有直接参考价值，尤其适合评估情绪可控语音合成与长音频生成的产品化能力。

核心解读

ModelScope 上线了 Scenema Audio，这是一个 13B 的表达式语音生成模型，支持零样本声音克隆、情绪表演和场景感知音频生成。其描述显示模型可在单次输出中实现情绪连续变化，支持 13 种语言、长文本旁白自动分段与音色一致性，说明语音生成正向更强控制力和更自然的场景化合成演进。

#模型发布#AI模型#开发者工具