语音克隆归档

Fish Audio 的 OpenAudio S1：新一代语音生成，让机器也能“声临其境”！

2025年6月17日14时作者小兵的AI视界

OpenAudio S1 是 Fish Audio 推出的多语言 TTS 模型，基于超过200万小时的音频数据训练，采用双自回归架构和强化学习与人类反馈技术。支持13种语言、40亿参数版本及5亿参数开源版，并具备零样本语音克隆功能。

支持1107种语言+语音克隆！Ebook2Audiobook一键解锁全球有声书

2025年5月8日14时作者小兵的AI视界

和空间的限制。为了解决这一问题，开源工具
ebook2audiobook
应运而生。
它能够将电子书

微信AI生态！微信聊天记录微调+微信数字分身+微信声音克隆！

2025年4月5日11时作者 GitHubStore

使用微信聊天记录微调大语言模型实现高质量声音克隆，并绑定到微信机器人生成数字分身。项目包括数据准备、模型下载与训练、多卡训练及接口推理等步骤。

Orpheus 3B – 高质量、情感丰富的文本转语音，技术面试中提供编码问题实时 AI 辅助的工具，

2025年3月20日11时作者每日AI新工具

Orpheus TTS 提供语音克隆、情感控制和低延迟功能的开源 TTS 系统。CrackCode 是一款隐蔽的 AI 面试助手。Claude Code but with OpenAI Models 使用 OpenAI 模型提供实时代码建议。Local Whisper 实现本地实时语音转录，YT Navigator 是一个高效的 YouTube 内容搜索工具。

实时语音转换工具Seed-VC

2025年3月17日16时作者 GitHubStore

🎶。无需任何训练，只需1~30秒的参考语音，即可克隆声音。
我们支持进一步使用自定义数据进行微调，以

TTS模型也要过年了！又一款超逼真TTS模型发布，还支持带情感的语音克隆！

2025年1月26日12时作者开源星探

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31