AI语音合成新标杆!开源10小时斩获8K Star!1B参数实现电影级人声!
一款名为CSM的新开源TTS模型由Sesame最新发布,能够生成带有上下文情感、自然语气和音调变化的人工智能语音。它具有高保真效果、端到端Transformer生成能力、上下文理解以及实时语音生成等功能。
一款名为CSM的新开源TTS模型由Sesame最新发布,能够生成带有上下文情感、自然语气和音调变化的人工智能语音。它具有高保真效果、端到端Transformer生成能力、上下文理解以及实时语音生成等功能。
一款名为Kokoro TTS的开源文本转语音模型凭借其82M参数和高效性能迅速走红。它支持多种语言,并能在普通CPU上实现近乎实时的语音生成,适用于语音助手、有声读物等应用场景。