首页/supertone-inc/supertonic — 闪电级本地多语言 TTS,ONNX 原生运行,无需 GPU(4.4k ⭐,今日 +859)

supertone-inc/supertonic — 闪电级本地多语言 TTS,ONNX 原生运行,无需 GPU(4.4k ⭐,今日 +859)

0 次浏览
2026/5/14

supertone-inc/supertonic — 闪电级本地多语言 TTS

GitHub: https://github.com/supertone-inc/supertonic Stars: 4,375 ⭐(今日 +859 🔥) 作者: Supertone Inc.(专业音频 AI 公司) 语言: Python / C++

项目简介

supertonic 是 Supertone(专注音频 AI 的韩国公司)开源的本地多语言 TTS(文字转语音)引擎。通过 ONNX 格式原生运行,无需 GPU 即可在 CPU 上实现实时语音合成,同时保持媲美云端服务的音质。

核心优势

极速推理

  • 实时因子 > 20x:生成 1 秒音频仅需 50ms(CPU)
  • ONNX Runtime 深度优化,充分利用 CPU SIMD 指令
  • 首字延迟 < 100ms,适合流式输出场景

真正的本地运行

  • 无需 GPU,普通笔记本 CPU 即可流畅运行
  • 模型大小 50-200MB(视音质档位)
  • 完全离线,数据不出本机

多语言支持

  • 中文(普通话)✓
  • 英语 ✓
  • 日语 ✓
  • 韩语 ✓
  • 更多语言持续添加中

高音质

  • 24kHz / 48kHz 音频输出
  • 自然的语调与节奏
  • 支持情感风格控制(中性/愉悦/严肃等)

快速使用

from supertonic import TTS

tts = TTS(language="zh", quality="high")

# 同步生成
audio = tts.synthesize("你好,这是 supertonic 语音合成测试。")
audio.save("output.wav")

# 流式生成(低延迟)
for chunk in tts.stream("这是一段较长的文本,将以流式方式输出音频。"):
    play_audio(chunk)

典型应用场景

  • AI Agent 语音输出:为 Claude Code、本地 LLM 添加语音反馈
  • 无障碍工具:屏幕阅读、文档朗读
  • 内容创作:播客脚本、视频配音自动化
  • 嵌入式设备:树莓派等低功耗设备上的语音交互
  • 隐私敏感场景:医疗、法律等不能上云的 TTS 需求

Supertone 背景

Supertone 是专注音频 AI 的专业公司,曾为游戏、影视行业提供 AI 配音解决方案。此次开源 supertonic 是其拓展开发者生态的重要举措,技术积累深厚,音质远超一般开源 TTS 项目。

免责声明

本站内容主要用于信息整理、技术研究与经验分享,不对第三方产品或服务的可用性、完整性作出任何明示或暗示的保证。

  • 本站所分享的资源、工具、教程等内容仅供学习与研究参考,请勿用于商业用途。
  • 部分内容可能来源于公开网络或开源社区,如涉及版权或其他合法权益问题,请通过联系方式与我们联系,我们将在核实后及时处理。
  • 如需将相关内容用于商业产品或盈利性业务,请自行联系权利方获取正式授权。
  • 因不当使用引发的版权或合规风险,由使用者自行承担。
  • 外部链接失效或无法访问属于正常现象,本站不保证所有链接的持续有效性。

转载或引用本文内容,请保留原文链接并注明来源。

评论

加载中...