情感语音的“开源先锋”！网易开源的一款TTS神器，2000种声音随意切换！

语音合成技术现已广泛应用于语音克隆、语音助手、配音服务、有声读物等领域，但如何让合成语音更具情感、更贴近人类表达，一直是语音行业研究的主要方向。

今天，推荐一款网易有道推出的 TTS 开源模型：EmotiVoice。

这是一个强大的开源 TTS 引擎，完全免费，支持中英文双语，还包含2000多种不同的音色，以及特色的情感合成功能，支持合成包含快乐、兴奋、悲伤、愤怒等广泛情感的语音。

同时它还提供 Web 界面和 OpenAI 兼容 API，确保使用与集成的便捷性。无论是个人开发者还是企业用户，EmotiVoice 都能满足多样化需求。

主要功能

• 多语言多音色：支持英语和中文，提供 2000+ 种独特音色。
• 多种情绪模拟：轻松生成带有开心、伤心、愤怒、平静、惊讶、害羞等情感的语音。
• 语音克隆：用私有音频数据定制专属音色。
• 提示控制生成：利用提示词精调语音风格与表达。
• Web UI + API 双支持：提供网页操作界面及OpenAI风格API接入。

快速使用

想要体验 EmotiVoice 最简单的方法就是运行 Docker 镜像。

运行 EmotiVoice 镜像指令：

docker run -dp 127.0.0.1:8501:8501 syq163/emoti-voice:latest

Docker 镜像更新指令：

docker pull syq163/emoti-voice:latest
docker run -dp 127.0.0.1:8501:8501 -p 127.0.0.1:8000:8000 syq163/emoti-voice:latest

如果Docker运行成功，就可以打开浏览器，导航到 http://localhost:8501，之后可以直接体验EmotiVoice强大的TTS功能。

另外一种大众的部署方式，就是本地安装。

conda create -n EmotiVoice python=3.8 -y
conda activate EmotiVoice
pip install torch torchaudio
pip install numpy numba scipy transformers soundfile yacs g2p_en jieba pypinyin pypinyin_dict
python -m nltk.downloader "averaged_perceptron_tagger_eng"

下载模型文件

git lfs install
git lfs clone https://huggingface.co/WangZeJun/simbert-base-chinese WangZeJun/simbert-base-chinese

# 或者下面的下载方式
git clone https://www.modelscope.cn/syq163/WangZeJun.git

运行Web界面

streamlit run demo_page.py

更多细节指南可以去 GitHub 的 Wiki 进行参考操作。

写在最后

很多人对AI语音的印象，还停留在“导航播报”“机械客服”“系统提示音”这些没有温度的场景中。

但随着 EmotiVoice 等多情感TTS模型的出现，我们开始意识到AI不只是能说话，它还能“像人一样”说话。

它可以为孩子讲故事、为用户安慰心情、为创作者激发灵感、为逝去的声音留下回响。

而且，它还是完全免费开源、灵活易接入的工具，不再被商业封闭所束缚。

如果你正在找一个功能强、质量高、部署方便的开源 TTS 系统，不妨试试网易这款开源TTS引擎。

GitHub 项目地址：https://github.com/netease-youdao/EmotiVoice

● 一款改变你视频下载体验的神器：MediaGo

● 新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star

● 最新最全 VSCODE 插件推荐（2023版）

● Star 50.3k！超棒的国产远程桌面开源应用火了！

● 超牛的AI物理引擎项目，刚开源不到一天，就飙升到超9K Star！突破物理仿真极限！

（文：开源星探）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

主要功能

快速使用

写在最后

发表评论 取消回复

发表评论取消回复