语音转换技术正在改变我们与声音互动的方式,而 AI 技术的快速发展也涌现了很多零样本语音克隆工具。
对于此类TTS工具,即使最低1秒钟也可以完美模仿你自己或其他人的声音,所以如果你平时还在付费买配音服务,那大可不必。
今天为大家推荐一款超强大的开源语音转换和歌曲转换工具:Seed-VC。

是的,它不仅具备语音克隆、文转语音,还具备歌声转换的功能。
它是基于字节跳动 SEED-TTS 架构开发的开源模型,利用先进的上下文学习技术,实现了无需训练的零样本语音和歌声转换。
无论你是想模仿明星的声音,还是为游戏角色配音,Seed-VC 只需 1 到 30 秒的参考音频,就能将你的语音瞬间转化为目标风格。
更令人兴奋的是,它支持实时转换,延迟低至 300 毫秒,堪称在线会议和直播的“声音魔法师”。

核心功能
-
• 零样本语音克隆:无需预训练,仅凭 1 到 30 秒的参考音频即可克隆目标声音。 -
• 实时语音转换:算法延迟约 300 毫秒,设备侧延迟约 100 毫秒,总延迟低至 400 毫秒。 -
• AI 歌声转换:支持 歌声转换(SVC),支持音调调整,保留音乐性。 -
• 低门槛微调:只需 1 条语音(几秒钟) 即可训练新的说话人风格。
快速使用
Seed-VC 支持本地部署和 GUI 界面,可自行选择适合自己的那一种。下面介绍下各个功能的WebUI启动方式及参数说明。
语音转换 Web UI:
python app_vc.py --checkpoint <path-to-checkpoint> --config <path-to-config>
• checkpoint 模型检查点路径,若为空将自动下载默认模型 (seed-uvit-whisper-small-wavenet) • config 模型配置文件路径,若为空将自动下载默认配置
然后在浏览器中打开 http://localhost:7860/
使用 Web 界面。
歌声转换 Web UI:
python app_svc.py --checkpoint <path-to-checkpoint> --config <path-to-config>
• checkpoint 模型检查点路径,若为空将自动下载默认模型 (seed-uvit-whisper-base) • config 模型配置文件路径,若为空将自动下载默认配置
集成 Web UI:
python app.py
此命令将仅加载预训练模型进行零样本推理。要使用自定义检查点,请按上述步骤运行 app_vc.py
或 app_svc.py
。
实时语音转换 GUI:
python real-time-gui.py --checkpoint-path <path-to-checkpoint> --config-path <path-to-config>
• checkpoint 模型检查点路径,若为空将自动下载默认模型 (seed-uvit-tat-xlsr-tiny) • config 模型配置文件路径,若为空将自动下载默认配置
适用场景
-
• AI 语音克隆:让 AI 说话像你!配音、虚拟主播、数字人 -
• AI 歌声转换(SVC):让 AI 翻唱你喜欢的歌曲 -
• 游戏语音变声:变声聊天,游戏语音伪装 -
• 实时语音转换:直播、电话会议、匿名语音 -
• 影视后期:让 AI 给角色配音,减少配音成本
写在最后
Seed-VC 作为零样本语音 & 歌声转换模型,无需训练即可克隆声音,并支持实时转换,非常适用于 AI 语音合成、语音伪装、AI 歌声合成等应用场景。
如果你希望快速克隆语音、做 AI 翻唱、进行实时语音转换,Seed-VC 可以作为日后创作利器之一!
GitHub 项目地址:https://github.com/Plachtaa/seed-vc

● 一款改变你视频下载体验的神器:MediaGo
● 新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star
● 最新最全 VSCODE 插件推荐(2023版)
● Star 50.3k!超棒的国产远程桌面开源应用火了!
● 超牛的AI物理引擎项目,刚开源不到一天,就飙升到超9K Star!突破物理仿真极限!

(文:开源星探)