OpenMOSS/MOSS-TTS — 开源语音生成全家桶,零样本克隆+31语言+实时流式(2k ⭐)
0 次浏览
2026/5/29
OpenMOSS/MOSS-TTS — 开源语音生成模型全家桶
GitHub: https://github.com/OpenMOSS/MOSS-TTS Stars: 2,266 (今日 trending) 作者: MOSI.AI + OpenMOSS 团队 定位: 覆盖语音生成全场景的生产级开源模型家族
模型阵容
| 模型 | 参数 | 用途 |
|---|---|---|
| MOSS-TTS-v1.5 | 8B | 旗舰零样本 TTS |
| MOSS-TTS-Local-Transformer | 1.7B | 轻量流式 |
| MOSS-TTSD-v1.0 | 8B | 多说话人对话生成 |
| MOSS-VoiceGenerator | 1.7B | 文本提示声音设计 |
| MOSS-SoundEffect-v2.0 | 1.3B | 音效生成 |
| MOSS-TTS-Realtime | 1.7B | 实时语音 Agent |
| MOSS-TTS-Nano | ~100M | CPU 可部署轻量版 |
核心能力
- 零样本声音克隆 — 几秒参考音频即可克隆
- 长文本稳定合成 — 不出现质量退化
- 细粒度控制 — 支持拼音、音素、时长精确控制
- 低延迟流式 — 180ms TTFB,适合实时对话 Agent
- 31 种语言 — 含粤语、印地语、越南语等小语种
适合场景
构建语音 Agent、有声内容创作、不想依赖商业 TTS API 的开发者和研究团队。
免责声明
本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。
- 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
- 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
- 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
- 因不当使用引发的版权或合规风险,由使用者自行承担。
- 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。
转载或引用本文内容,请保留原文链接并注明来源。
评论
加载中...