返回精选
AI 精选动态 智能评分 62

来源: twitter关注列表
作者: Artificial Analysis (@ArtificialAnlys)
发布于: 2026-05-12
收录于: 2026-05-12
AI 推荐理由
该报道提供了多个主流语音模型的实测响应时延对比,对开发者评估性能具有参考价值。
核心解读
在客户服务场景的典型对话中,各模型平均耗时均低于7分钟。Gemini 2.5 Flash Native Audio Preview最快,耗时2.4分钟,随后是GPT-Realtime-2(Minimal)2.6分钟、GPT-Realtime-2(Medium)2.9分钟,而GPT Realtime Mini最慢达6.4分钟,超过Grok Voice Think Fast 1.0的5.6分钟和GPT-Realtime-1.5的4.8分钟。
#语音交互#模型性能#AI评估