首页/🤖 AI 应用/VoiceBox - 开源语音合成工作室

VoiceBox - 开源语音合成工作室

128 次浏览

2026/3/4

🤖 AI 应用

VoiceBox 是一个基于 Qwen3-TTS 的开源语音合成工作室，提供专业级的文本转语音和语音克隆功能。

核心功能

高质量 TTS

基于 Qwen3-TTS 模型，生成自然流畅的语音，支持多种语言和情感控制。

语音克隆

只需几秒钟的音频样本，即可克隆任意说话人的音色，生成逼真的合成语音。

工作室界面

提供直观的 Web 界面，支持实时预览、参数调节和批量处理。

使用场景

有声书和播客制作
游戏和动画角色配音
无障碍阅读辅助
内容创作者的语音工具

优势与不足

优势

完全开源，可本地部署
基于 Qwen3-TTS，中文效果出色
12K Star，TypeScript 实现

不足

需要较好的 GPU 支持
语音克隆有伦理风险

类似项目

Coqui TTS：开源 TTS 引擎
Bark：Suno 的文本转音频模型

下载地址

GitHub

免责声明

本站内容主要用于信息整理、技术研究与经验分享，不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

本站所分享的资源、工具、教程等内容仅供学习与研究参考，请勿用于商业用途。

部分内容可能来源于公开网络或开源社区，如涉及版权或其他合法权益问题，请通过联系方式与我们联系，我们将在核实后及时处理。

如需将相关内容用于商业产品或盈利性业务，请自行联系权利方获取正式授权。

因不当使用引发的版权或合规风险，由使用者自行承担。

外部链接失效或无法访问属于正常现象，本站不保证所有链接的持续有效性。

转载或引用本文内容，请保留原文链接并注明来源。

加载中...

下载地址

GitHub

VoiceBox - 开源语音合成工作室

核心功能

高质量 TTS

语音克隆

工作室界面

使用场景

优势与不足

优势

不足

类似项目

下载地址

免责声明

评论

下载地址

相关资源