多研发团队共同开源,AI超自然声音克隆TTS,支持中文。
TTS工具Spark-TTS由SparkAudio开发,支持中文和英文,基于5亿参数的Qwen2.5 LLM和BiCodec技术。它具有零样本语音克隆、中英混合生成等功能,实现跨语言场景应用。
TTS工具Spark-TTS由SparkAudio开发,支持中文和英文,基于5亿参数的Qwen2.5 LLM和BiCodec技术。它具有零样本语音克隆、中英混合生成等功能,实现跨语言场景应用。
Spark-TTS 是一个先进的文本到语音系统,利用大型语言模型实现高度准确和自然的声音合成。它简洁高效,支持零样本语音克隆及双语支持,具备可控语音生成功能。
Spark-TTS 是一款全新的高质量语音合成系统,支持零样本语音克隆、细粒度语音控制、跨语言生成等功能。它结合了 BiCodec 编解码器和 Qwen-2.5 思维链技术,实现自然且高效的语音生成,适用于多种场景如有声读物、多语言内容及AI角色配音。