AI语音克隆神器！Seed-VC：零样本实时转换语音和歌声，实时语音延迟最低300毫秒！

语音转换技术正在改变我们与声音互动的方式，而 AI 技术的快速发展也涌现了很多零样本语音克隆工具。

对于此类TTS工具，即使最低1秒钟也可以完美模仿你自己或其他人的声音，所以如果你平时还在付费买配音服务，那大可不必。

今天为大家推荐一款超强大的开源语音转换和歌曲转换工具：Seed-VC。

是的，它不仅具备语音克隆、文转语音，还具备歌声转换的功能。

它是基于字节跳动 SEED-TTS 架构开发的开源模型，利用先进的上下文学习技术，实现了无需训练的零样本语音和歌声转换。

无论你是想模仿明星的声音，还是为游戏角色配音，Seed-VC 只需 1 到 30 秒的参考音频，就能将你的语音瞬间转化为目标风格。

更令人兴奋的是，它支持实时转换，延迟低至 300 毫秒，堪称在线会议和直播的“声音魔法师”。

Seed-VC 支持本地部署和 GUI 界面，可自行选择适合自己的那一种。下面介绍下各个功能的WebUI启动方式及参数说明。

语音转换 Web UI:

python app_vc.py --checkpoint <path-to-checkpoint> --config <path-to-config>

• checkpoint 模型检查点路径，若为空将自动下载默认模型 (seed-uvit-whisper-small-wavenet)

• config 模型配置文件路径，若为空将自动下载默认配置

然后在浏览器中打开 http://localhost:7860/ 使用 Web 界面。

歌声转换 Web UI:

python app_svc.py --checkpoint <path-to-checkpoint> --config <path-to-config>

• checkpoint 模型检查点路径，若为空将自动下载默认模型 (seed-uvit-whisper-base)

• config 模型配置文件路径，若为空将自动下载默认配置

集成 Web UI:

python app.py

此命令将仅加载预训练模型进行零样本推理。要使用自定义检查点，请按上述步骤运行 app_vc.py 或 app_svc.py。

实时语音转换 GUI:

python real-time-gui.py --checkpoint-path <path-to-checkpoint> --config-path <path-to-config>

• checkpoint 模型检查点路径，若为空将自动下载默认模型 (seed-uvit-tat-xlsr-tiny)

• config 模型配置文件路径，若为空将自动下载默认配置

Seed-VC 作为零样本语音 & 歌声转换模型，无需训练即可克隆声音，并支持实时转换，非常适用于 AI 语音合成、语音伪装、AI 歌声合成等应用场景。

如果你希望快速克隆语音、做 AI 翻唱、进行实时语音转换，Seed-VC 可以作为日后创作利器之一！

GitHub 项目地址：https://github.com/Plachtaa/seed-vc

● 一款改变你视频下载体验的神器：MediaGo

● 新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star

● 最新最全 VSCODE 插件推荐（2023版）

● Star 50.3k！超棒的国产远程桌面开源应用火了！

● 超牛的AI物理引擎项目，刚开源不到一天，就飙升到超9K Star！突破物理仿真极限！

（文：开源星探）