supertone-inc/supertonic — 闪电级本地多语言 TTS,ONNX 原生运行,无需 GPU(4.4k ⭐,今日 +859)
supertone-inc/supertonic — 闪电级本地多语言 TTS
GitHub: https://github.com/supertone-inc/supertonic Stars: 4,375 ⭐(今日 +859 🔥) 作者: Supertone Inc.(专业音频 AI 公司) 语言: Python / C++
项目简介
supertonic 是 Supertone(专注音频 AI 的韩国公司)开源的本地多语言 TTS(文字转语音)引擎。通过 ONNX 格式原生运行,无需 GPU 即可在 CPU 上实现实时语音合成,同时保持媲美云端服务的音质。
核心优势
极速推理
- 实时因子 > 20x:生成 1 秒音频仅需 50ms(CPU)
- ONNX Runtime 深度优化,充分利用 CPU SIMD 指令
- 首字延迟 < 100ms,适合流式输出场景
真正的本地运行
- 无需 GPU,普通笔记本 CPU 即可流畅运行
- 模型大小 50-200MB(视音质档位)
- 完全离线,数据不出本机
多语言支持
- 中文(普通话)✓
- 英语 ✓
- 日语 ✓
- 韩语 ✓
- 更多语言持续添加中
高音质
- 24kHz / 48kHz 音频输出
- 自然的语调与节奏
- 支持情感风格控制(中性/愉悦/严肃等)
快速使用
from supertonic import TTS
tts = TTS(language="zh", quality="high")
# 同步生成
audio = tts.synthesize("你好,这是 supertonic 语音合成测试。")
audio.save("output.wav")
# 流式生成(低延迟)
for chunk in tts.stream("这是一段较长的文本,将以流式方式输出音频。"):
play_audio(chunk)
典型应用场景
- AI Agent 语音输出:为 Claude Code、本地 LLM 添加语音反馈
- 无障碍工具:屏幕阅读、文档朗读
- 内容创作:播客脚本、视频配音自动化
- 嵌入式设备:树莓派等低功耗设备上的语音交互
- 隐私敏感场景:医疗、法律等不能上云的 TTS 需求
Supertone 背景
Supertone 是专注音频 AI 的专业公司,曾为游戏、影视行业提供 AI 配音解决方案。此次开源 supertonic 是其拓展开发者生态的重要举措,技术积累深厚,音质远超一般开源 TTS 项目。
免责声明
本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。
- 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
- 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
- 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
- 因不当使用引发的版权或合规风险,由使用者自行承担。
- 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。
转载或引用本文内容,请保留原文链接并注明来源。
评论
加载中...
相关资源
tinyhumansai/openhuman — 你的私人 AI 超级智能,极度私密、简单而强大(5.6k ⭐,今日 +1,696)
定位为个人 AI 超级智能的开源项目,强调私密性、简单易用与强大能力,今日单日新增 1,696 star,是近期增速最快...
rohitg00/agentmemory — AI 编程 Agent 持久化记忆系统 #1,真实 Benchmark 验证(5.8k ⭐,今日 +1,048)
基于真实 Benchmark 验证的 AI 编程 Agent 持久化记忆系统,让 Agent 跨会话记住项目上下文、用户...
yikart/AiToEarn — 用 AI 赚钱的开源工具集,今日 +1,282 star 爆火(11.8k ⭐)
帮助普通人用 AI 创造收入的开源项目,整合自动化内容生产、AI 变现策略与工具链,今日新增 1,282 star,是 ...