还记得Suno AI音乐刚出来的时候有多火爆吗。

真的是铺天盖地的全都是它。。。
转眼间Suno AI的用户量也已经超千万了。

整个的生态做得还是非常不错的。
可能这个赛道并没有那么卷吧,效果好的AI音乐模型之前没发现有开源的。
今天还真发现了一个,刚开源没多久,效果还不错。
文本生成语音叫TTS,文本生成音乐应该叫什么?
TTM(text to music)?
它会的实在是太多了!!
-
不同音乐风格:涉及摇滚、流行、爵士、说唱、民谣、金属等多种风格。
-
多样语言版本:支持中文(普通话、粤语)、英文、日文、韩文等语言。
-
特色演唱技巧:能呈现特殊演唱技巧,像源自爵士的拟声吟唱(Scatting)、死亡咆哮(Death Growl)、真假音混合(Mix Voice)、强力高音与连音等 。
-
儿童歌曲:有专门的儿童歌曲类别,例如一首歌词充满童趣的儿童歌曲。
扫码加入AI交流群
获得更多技术支持和交流
(请注明自己的职业)

项目简介
YuE(乐)是一个开源的全歌曲生成基础模型,通过给定的歌词生成完整的歌曲音频。解决了生成时长达数分钟、同时包含人声和伴奏的全歌曲的困难。YuE能够在长时序音乐的背景下,保持歌词与音乐的高度一致性,生成旋律流畅且具备音乐性和可控性的歌曲。模型结合了语义增强的音频分词器、双标记技术和歌词思维链等方法,使其能在多个音乐流派和风格中进行多样化的生成,包括重金属、爵士、说唱等。
DEMO
文章里放不了太多的音频,我挑几个给大家听听,想看完整版的DEMO可以到这个链接里去看。
https://map-yue.github.io/
1、重金属
2、说唱
3、儿歌
4、粤语歌
技术特点
-
全歌曲生成:与传统的短音频生成不同,YuE可以生成完整的、数分钟长的歌曲,包含人声和伴奏,确保歌词与旋律的协调性。
-
创新的音频分词器:采用语义增强的音频分词器,有助于更精准地捕捉和生成音乐的细节。
-
双标记技术:通过双标记的方式,使得生成的歌曲在保持歌词一致性的同时,也能保留高质量的音乐性。
-
多样化风格生成:YuE支持多种音乐风格的生成,包括金属、爵士、说唱等,具备较强的风格适应性。
-
歌词思维链:结合歌词思维链技术,有助于在生成过程中更好地理解和表现歌词的情感与主题。
项目链接
https://github.com/multimodal-art-projection/YuE
关注「开源AI项目落地」公众号
(文:开源AI项目落地)