语音合成归档

7k星星爆火！用微信聊天记录训练一个自己的数字分身回信息，还能克隆声音回复语音消息。

下午11时 2025/05/14 作者开源AI项目落地

通过微信聊天记录和语音消息，结合大语言模型与语音合成技术，打造高度个性化的数字分身。支持从CSV格式导出聊天数据并训练模型，实现自动回复文字和语音功能。

上午11时 2025/04/14 作者 GitHubStore

Orpheus TTS 是基于 Llama-3b 骨干网络的开源文本到语音系统，展示了使用大型语言模型（LLMs）进行语音合成的新能力。它支持类人语音、零样本语音克隆及指导情感和语调控制等功能，且具备低延迟特性。

下午4时 2025/02/27 作者量子位

Llasa团队分享了他们基于Transformer的语音合成模型的研究成果，该模型展示了通过扩展计算资源来提高语音合成效果的能力。研究揭示了训练时间和推理时间扩展对性能的影响，并开源了代码和权重以供其他研究人员参考。

下午12时 2025/01/13 作者 GitHubStore

语音合成API接口介绍，包括内置角色合成文字、同语言克隆音色合成、兼容OpenAI TTS和不同语言音色克隆等功能。