AI 精选动态
智能评分 60
网红峰哥AI分身开源项目Leaf
AI 推荐理由
与现有语音克隆项目相比,该项目强调实时性和人格注入,工程优化思路清晰,值得开发者复现或借鉴。核心解读
开发者Leaf开源了一个实时AI分身项目,能将网红峰哥的说话风格、音色和人格注入AI,实现实时对话。工程延迟压缩到1秒以内,语音识别使用Cartesia ink-whisper降噪防误触发,大模型选用MiniMax高速版(首字响应361毫秒),语音合成采用VoxCPM开源克隆(15秒素材即可复刻),人格蒸馏使用女娲Skill从直播语料提取特征。优化后实际体感2-3秒,普通人半小时内可跑通。
全文
有人把网红峰哥做成了能实时打电话的 AI 分身,
连说话风格都一模一样。
这是开发者 Leaf 刚开源的项目,
把实时对话、音色克隆、人格注入三件事打通了,
工程延迟压到一秒以内。
最厉害的是拆解式优化思路,
把语音链路拆成三步逐个击破:
・语音识别用 Cartesia ink-whisper, 降噪防误触发
・大模型选 MiniMax 高速版,首字响应三百六十一毫秒
・语音合成用 VoxCPM 开源克隆,十五秒素材就能复刻
从最初八到二十秒的语音邮件感,
硬生生优化到实际体感两到三秒,
跟打电话没区别,光声音像还不够,项目用女娲 Skill 做人格蒸馏,从直播语料里提取口头禅、思维方式、表达逻辑,
聊起来真的像本人在跟你说话,
普通人半小时就能跑通:
把项目克隆到本地
扔给 Claude Code 或 Cursor 说帮我配置启动
填两个 API Key 就能用
想换成任何人都可以,
准备十五秒清晰语音加一段人格描述就行。
GitHub 链接放评论区,想做自己 AI 分身的直接拿去用。
https://video.twimg.com/amplify_video/2070531734983086080/vid/avc1/1920x1080/pvAusrgozjuxle4C.mp4?tag=28
> **引用原帖 Leaf Yeah! (@leaf_sanren):**
> https://t.co/izjIG6IhON
> https://x.com/leaf_sanren/status/2070109085920624864
AYi (@AYi_AInotes): https://t.co/8fKb1kpOof