supertone-inc/supertonic — 闪电级本地多语言 TTS，ONNX 原生运行，无需 GPU（4.4k ⭐，今日 +859）

supertone-inc/supertonic — 闪电级本地多语言 TTS

GitHub: https://github.com/supertone-inc/supertonic Stars: 4,375 ⭐（今日 +859 🔥）作者: Supertone Inc.（专业音频 AI 公司）语言: Python / C++

项目简介

supertonic 是 Supertone（专注音频 AI 的韩国公司）开源的本地多语言 TTS（文字转语音）引擎。通过 ONNX 格式原生运行，无需 GPU 即可在 CPU 上实现实时语音合成，同时保持媲美云端服务的音质。

核心优势

极速推理

实时因子 > 20x：生成 1 秒音频仅需 50ms（CPU）
ONNX Runtime 深度优化，充分利用 CPU SIMD 指令
首字延迟 < 100ms，适合流式输出场景

真正的本地运行

无需 GPU，普通笔记本 CPU 即可流畅运行
模型大小 50-200MB（视音质档位）
完全离线，数据不出本机

多语言支持

中文（普通话）✓
英语 ✓
日语 ✓
韩语 ✓
更多语言持续添加中

高音质

24kHz / 48kHz 音频输出
自然的语调与节奏
支持情感风格控制（中性/愉悦/严肃等）

快速使用

from supertonic import TTS

tts = TTS(language="zh", quality="high")

# 同步生成
audio = tts.synthesize("你好，这是 supertonic 语音合成测试。")
audio.save("output.wav")

# 流式生成（低延迟）
for chunk in tts.stream("这是一段较长的文本，将以流式方式输出音频。"):
    play_audio(chunk)

典型应用场景

AI Agent 语音输出：为 Claude Code、本地 LLM 添加语音反馈
无障碍工具：屏幕阅读、文档朗读
内容创作：播客脚本、视频配音自动化
嵌入式设备：树莓派等低功耗设备上的语音交互
隐私敏感场景：医疗、法律等不能上云的 TTS 需求

Supertone 背景

Supertone 是专注音频 AI 的专业公司，曾为游戏、影视行业提供 AI 配音解决方案。此次开源 supertonic 是其拓展开发者生态的重要举措，技术积累深厚，音质远超一般开源 TTS 项目。