返回精选
AI 精选动态 智能评分 66

Pipecat 开源语音框架

来源: twitter关注列表
作者: meng shao (@shao__meng)
发布于: 2026-05-21
收录于: 2026-05-21
AI 推荐理由
值得点开原文查看其模块化流水线与多供应商适配方式,便于评估是否适合直接用于实时语音代理原型或二次集成。
核心解读
Pipecat 团队发布了一个用于构建实时语音 AI agents 的开源 Python 框架,可编排音频、视频、AI services、传输层和对话流水线。该框架采用 voice-first 架构,内置 WebRTC 和 WebSocket 传输,支持 STT、TTS、对话逻辑和低延迟流式交互,可用于 voice assistants、AI companions、多模态界面、交互式故事、客服和复杂对话系统。其支持的服务包括 STT 的 Deepgram、AssemblyAI、OpenAI Whisper、Groq、Azure、AWS、Google 等,LLM 的 OpenAI、Anthropic、Gemini、Groq、Mistral、Ollama、AWS、Azure 等,以及 TTS 的 OpenAI、ElevenLabs、Deepgram、Cartesia、Azure、AWS、Google 等;GitHub stars 超过 10.3k。
#开源#智能体#开发者工具