突然爆火的开源AI音乐生成模型：YuE，支持多语言、多风格、多专业级声乐表现！

点击上方“蓝色字体”关注我，每天推送“实用有趣的项目”！

音乐创作往往是灵感和技巧的结合，然而，创作一首完整的歌曲却需要大量的时间和专业知识。特别是如果你想要一首不只是简单的伴奏，而是拥有完整结构、丰富演唱表现和不同音乐风格的歌曲，这无疑是一个巨大的挑战。

此前有一些闭源的音乐模型已经取得了很好的效果，比如：Suno、udio、海绵音乐等等。

但在除夕前后有一款开源的音乐模型： YuE，突然就爆火起来了！

借助它可以生成长达5分钟的，包含人声和伴奏的高质量、完整音乐。

不仅支持多种语言，还能涵盖从流行到金属等各种风格，甚至带有独特的声乐表现。

项目简介

YuE 是一款基于 AI 技术的开源音乐生成模型，它能够从用户提供的歌词生成完整的歌曲。

YuE 不仅仅是生成旋律或伴奏，它能够在同一作品中结合人声与伴奏，提供完整的音乐结构。这意味着，你可以从一段歌词开始，得到一首高质量、具有完整曲式的音乐作品。

无论是前奏、主歌，还是合唱、桥段，YuE 都能精确生成。

当然它最大亮点是其多模态的能力，它不仅支持跨语言生成，还能在多种音乐风格中进行创作。

无论你喜欢金属、爵士，还是流行，甚至是混合语言的嘻哈风格，YuE 都能根据输入的歌词进行自动生成。

目前，YuE 自开源以来，收获了1.1k+ star，吸引了大量开发者和音乐创作者的关注。

特色功能

1、歌词到音乐的无缝转化

YuE 的核心功能是将给定的歌词转化为一首完整的音乐。

这意味着，用户只需提供歌词，YuE就能自动生成歌声与伴奏。

生成的歌曲不仅有歌词内容，还有与之契合的音乐元素，如和弦、节奏和旋律，确保歌曲完整且富有表现力。

2、多语言支持

YuE 支持多种语言生成，包括英语、中文、日语和韩语，甚至能够处理不同语言之间的混合。

例如，你可以创作一首中英混合的嘻哈歌曲，这也是大多数音乐的创作形式。

3、多种音乐风格生成

无论你喜欢哪种音乐风格，YuE 都能够生成与之匹配的歌曲。其支持的风格包括但不限于：

• 金属 (Metal)：激情澎湃，适合表达强烈情感。
• 爵士 (Jazz)：自由、灵活，充满创意。
• 流行 (Pop)：适合大众，轻松愉悦。
• 乡村 (Country)：质朴、自然。
• 抒情 (Ballad)：柔情、深情。
• 另类摇滚 (Alternative Rock)：创新与自由的结合。
• 儿歌 (Children’s Song)：简单、富有童趣。

4、专业级声乐表现

YuE不仅仅是一个简单的“歌声生成器”，它还能够展现专业级的声乐技巧。比如：

• 即兴演唱 (Scatting)：无词旋律的即兴创作，非常适合爵士风格。
• 低吼 (Death Growl)：极限的演唱方式，常见于金属音乐，带有强烈的情感表达。
• 混声 (Mix Voice)：融合胸声和头声的演唱技术，适合多种风格的演绎。

5、大规模参数，强大生成能力

YuE包含了62.2亿个参数，这使得它在音乐创作中能够理解更复杂的音符、旋律和结构，为创作者提供更加精确和高质量的音乐生成。

YuE 能够生成长度达五分钟的完整歌曲，音质上达到专业级别。这对于需要制作长篇音乐作品的用户来说，YuE 是一个非常强大的工具。

快速使用

YuE 对于硬件要求比较高：24GB 或以下内存的 GPU：最多可同时运行 2 个会话。对于完整歌曲的生成（多个会话，如 4 个或更多会话），使用至少拥有 80GB 内存的 GPU。

① 创建Python虚拟环境，安装 AI 依赖包

conda create -n yue python=3.8 # Python >=3.8 is recommended.
conda activate yue

conda install pytorch torchvision torchaudio cudatoolkit=11.8 -c pytorch -c nvidia
pip install -r requirements.txt

pip install flash-attn --no-build-isolation

② 下载推理代码和分词器

git lfs install
git clone https://github.com/multimodal-art-projection/YuE.git

cd YuE/inference/
git clone https://huggingface.co/m-a-p/xcodec_mini_infer

③ 运行推理

# This is the CoT mode.
cd YuE/inference/
python infer.py \
    --stage1_model m-a-p/YuE-s1-7B-anneal-en-cot \
    --stage2_model m-a-p/YuE-s2-1B-general \
    --genre_txt genre.txt \
    --lyrics_txt lyrics.txt \
    --run_n_segments 2 \
    --stage2_batch_size 4 \
    --output_dir ./output \
    --cuda_idx 0 \
    --max_new_tokens 3000

写在最后

YuE 是一款集多语言支持、多风格创作、专业级演唱技巧于一体的多模态音乐生成模型，它不仅极大提升了音乐创作的效率，也为创作者提供了更多的创作自由。

无论你是音乐爱好者、专业创作者，还是希望探索AI与艺术结合的开发者，YuE 都能为你打开全新的创作大门。

不需要复杂的乐理知识，不需要高昂的制作成本，YuE 让每一个人都能成为音乐创作的“编曲师”。

GitHub 项目地址：https://github.com/multimodal-art-projection/YuE

项目主页：https://map-yue.github.io

YuE模型：https://huggingface.co/m-a-p/YuE-s1-7B-anneal-en-cot

● 一款改变你视频下载体验的神器：MediaGo

● 新一代开源语音库CoQui TTS冲到了GitHub 20.5k Star

● 最新最全 VSCODE 插件推荐（2023版）

● Star 50.3k！超棒的国产远程桌面开源应用火了！

● 超牛的AI物理引擎项目，刚开源不到一天，就飙升到超9K Star！突破物理仿真极限！

（文：开源星探）

一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30

项目简介

特色功能

快速使用

写在最后

发表评论 取消回复

下载每时AI手机APP

发表评论取消回复