首页/Fish Speech — 顶级开源 TTS,媲美商业语音合成(26k ⭐)

Fish Speech — 顶级开源 TTS,媲美商业语音合成(26k ⭐)

0 次浏览
2026/3/12

Fish Speech 是什么?

Fish Speech 是由 fishaudio 团队开发的开源文字转语音(TTS)系统,目前 GitHub 超过 26,000 颗星,是开源 TTS 领域最受关注的项目之一。

核心能力

  • 零样本声音克隆:只需 10 秒参考音频,即可克隆任意声音
  • 多语言支持:支持中文、英文、日文、韩文等多种语言
  • 极低延迟:实时流式生成,适合对话场景
  • 高音质:采用最新声码器技术,音质媲美商业方案

对标商业产品

Fish Speech 的效果可以与 ElevenLabs、Azure TTS 等主流商业语音服务媲美,但完全免费开源,可本地部署,无数据隐私顾虑。

快速使用

pip install fish-speech
# 或通过 Docker
docker run -it fishaudio/fish-speech:latest

适用场景

  • 有声书/播客自动化生成
  • 视频配音
  • 语音助手/客服机器人
  • 无障碍辅助工具

GitHub 项目地址:https://github.com/fishaudio/fish-speech

免责声明

本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

  • 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
  • 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
  • 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
  • 因不当使用引发的版权或合规风险,由使用者自行承担。
  • 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。

转载或引用本文内容,请保留原文链接并注明来源。

评论

加载中...