返回精选
AI 精选动态 智能评分 67

Cartesia Sonic-3.5登顶Speech Arena

来源: twitter关注列表
作者: Artificial Analysis (@ArtificialAnlys)
发布于: 2026-05-22
收录于: 2026-05-22
AI 推荐理由
可据此判断当前 TTS 竞品格局:Sonic-3.5 以更高质量换取更高价格和中等速度,适合需要对比质量、成本与延迟的选型场景。
核心解读
Cartesia 的 Sonic-3.5 在 Artificial Analysis Speech Arena Leaderboard 上升至第 1 名,超过了 Inworld Realtime TTS 1.5 Max 和 Google 的 Gemini 3.1 Flash TTS。该模型支持 42 种语言,包括 9 种印度语言,提供 500+ 预置声音;在 1,144 次 arena 出场基础上取得 1,218 Elo 分(+16/-16),高于 Inworld 的 1,194 和 Gemini 的 1,209。定价为每 100 万字符 39 美元,快于 Gemini 3.1 Flash TTS 的 26.3 字符/秒,但慢于 Inworld Realtime TTS 1.5 Max 的 205 字符/秒;后两者价格分别为每 100 万字符 18.3 美元和 35 美元。
#模型发布#基准测试#产品更新