首页 🎨 创意工具 ⚡ 效率工具 📚 实战指南 🤖 AI 应用

首页/OpenMOSS/MOSS-TTS — 开源语音生成全家桶，零样本克隆+31语言+实时流式（2k ⭐）

OpenMOSS/MOSS-TTS — 开源语音生成全家桶，零样本克隆+31语言+实时流式（2k ⭐）

0 次浏览

2026/5/29

零样本克隆

OpenMOSS/MOSS-TTS — 开源语音生成模型全家桶

GitHub: https://github.com/OpenMOSS/MOSS-TTS Stars: 2,266 (今日 trending) 作者: MOSI.AI + OpenMOSS 团队定位: 覆盖语音生成全场景的生产级开源模型家族

模型阵容

模型	参数	用途
MOSS-TTS-v1.5	8B	旗舰零样本 TTS
MOSS-TTS-Local-Transformer	1.7B	轻量流式
MOSS-TTSD-v1.0	8B	多说话人对话生成
MOSS-VoiceGenerator	1.7B	文本提示声音设计
MOSS-SoundEffect-v2.0	1.3B	音效生成
MOSS-TTS-Realtime	1.7B	实时语音 Agent
MOSS-TTS-Nano	~100M	CPU 可部署轻量版

核心能力

零样本声音克隆 — 几秒参考音频即可克隆
长文本稳定合成 — 不出现质量退化
细粒度控制 — 支持拼音、音素、时长精确控制
低延迟流式 — 180ms TTFB，适合实时对话 Agent
31 种语言 — 含粤语、印地语、越南语等小语种

适合场景

构建语音 Agent、有声内容创作、不想依赖商业 TTS API 的开发者和研究团队。

免责声明

本站内容主要用于信息整理、技术研究与经验分享，不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

本站所分享的资源、工具、教程等内容仅供学习与研究参考，请勿用于商业用途。

部分内容可能来源于公开网络或开源社区，如涉及版权或其他合法权益问题，请通过联系方式与我们联系，我们将在核实后及时处理。

如需将相关内容用于商业产品或盈利性业务，请自行联系权利方获取正式授权。

因不当使用引发的版权或合规风险，由使用者自行承担。

外部链接失效或无法访问属于正常现象，本站不保证所有链接的持续有效性。

转载或引用本文内容，请保留原文链接并注明来源。

评论

加载中...

相关资源

Nango - AI 驱动的开源 API 集成中间件

开源 API 集成中间件，提供数百个预置 API、托管 OAuth 和 AI 自动生成集成代码，替代昂贵的企业级集成方案...

Cloudflare Agents - AI智能代理构建与部署平台

Cloudflare推出的AI代理开发框架，支持构建智能邮箱助手等AI应用，数据本地处理，无需第三方服务器...

FinceptTerminal - 开源金融终端

开源版彭博终端，提供AI投研代理、深度财报分析和多源市场情报的企业级金融数据工具...