AI 精选动态
智能评分 62
AI 推荐理由
该报道提供了多个主流语音模型的实测响应时延对比,对开发者评估性能具有参考价值。核心解读
在客户服务场景的典型对话中,各模型平均耗时均低于7分钟。Gemini 2.5 Flash Native Audio Preview最快,耗时2.4分钟,随后是GPT-Realtime-2(Minimal)2.6分钟、GPT-Realtime-2(Medium)2.9分钟,而GPT Realtime Mini最慢达6.4分钟,超过Grok Voice Think Fast 1.0的5.6分钟和GPT-Realtime-1.5的4.8分钟。