多语言合成归档

MiniMax推出高质量文本转语音模型MiniMax-Speech

上午8时 2025/05/17 作者 NLP工程化

MiniMax发布的新模型MiniMax-Speech通过可学习的说话人编码器和Flow-VAE架构提高了文本转语音的质量与保真度，在零样本情况下实现了跨语言合成，多项测试中表现优异。

下午11时 2025/05/15 作者开源星探

成为
全球TTS双榜第一
！
不仅登顶了Artificial Analysis Arena榜单，力压

上午11时 2025/04/10 作者 GitHubStore

Spark-TTS 是一个先进的文本到语音系统，利用大型语言模型实现高度准确和自然的声音合成。它简洁高效，支持零样本语音克隆及双语支持，具备可控语音生成功能。