Fish Speech — 顶级开源 TTS,媲美商业语音合成(26k ⭐)
0 次浏览
2026/3/12
Fish Speech 是什么?
Fish Speech 是由 fishaudio 团队开发的开源文字转语音(TTS)系统,目前 GitHub 超过 26,000 颗星,是开源 TTS 领域最受关注的项目之一。
核心能力
- 零样本声音克隆:只需 10 秒参考音频,即可克隆任意声音
- 多语言支持:支持中文、英文、日文、韩文等多种语言
- 极低延迟:实时流式生成,适合对话场景
- 高音质:采用最新声码器技术,音质媲美商业方案
对标商业产品
Fish Speech 的效果可以与 ElevenLabs、Azure TTS 等主流商业语音服务媲美,但完全免费开源,可本地部署,无数据隐私顾虑。
快速使用
pip install fish-speech
# 或通过 Docker
docker run -it fishaudio/fish-speech:latest
适用场景
- 有声书/播客自动化生成
- 视频配音
- 语音助手/客服机器人
- 无障碍辅助工具
GitHub 项目地址:https://github.com/fishaudio/fish-speech
免责声明
本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。
- 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
- 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
- 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
- 因不当使用引发的版权或合规风险,由使用者自行承担。
- 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。
转载或引用本文内容,请保留原文链接并注明来源。
评论
加载中...
相关资源
Google A2UI — 自然语言驱动的 UI 自动化框架(13k ⭐)
google/A2UI 是 Google 开源的 Agent-to-UI 框架,让 AI Agent 通过自然语言理解和...
Lightpanda — 专为 AI 和自动化设计的无头浏览器(15.7k ⭐)
lightpanda-io/browser 是专为 AI Agent 和自动化任务优化的无头浏览器,内存占用极低、执行速...
Page Agent — 阿里开源网页 GUI 自动化,自然语言控制浏览器(6.4k ⭐)
alibaba/page-agent 是阿里开源的 JavaScript 网页内 GUI Agent,用自然语言指令直接...