Suno AI音乐开源版终于来了,我的感觉是它什么都会唱,难道歌星也会被AI取代吗?

还记得Suno AI音乐刚出来的时候有多火爆吗。



真的是铺天盖地的全都是它。。。


转眼间Suno AI的用户量也已经超千万了。



整个的生态做得还是非常不错的。


可能这个赛道并没有那么卷吧,效果好的AI音乐模型之前没发现有开源的。


今天还真发现了一个,刚开源没多久,效果还不错。


文本生成语音叫TTS,文本生成音乐应该叫什么?


TTM(text to music)?


它会的实在是太多了!!


  • 不同音乐风格:涉及摇滚、流行、爵士、说唱、民谣、金属等多种风格。


  • 多样语言版本:支持中文(普通话、粤语)、英文、日文、韩文等语言。


  • 特色演唱技巧:能呈现特殊演唱技巧,像源自爵士的拟声吟唱(Scatting)、死亡咆哮(Death Growl)、真假音混合(Mix Voice)、强力高音与连音等 。


  • 儿童歌曲:有专门的儿童歌曲类别,例如一首歌词充满童趣的儿童歌曲。


扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)


项目简介


YuE(乐)是一个开源的全歌曲生成基础模型,通过给定的歌词生成完整的歌曲音频。解决了生成时长达数分钟、同时包含人声和伴奏的全歌曲的困难。YuE能够在长时序音乐的背景下,保持歌词与音乐的高度一致性,生成旋律流畅且具备音乐性和可控性的歌曲。模型结合了语义增强的音频分词器、双标记技术和歌词思维链等方法,使其能在多个音乐流派和风格中进行多样化的生成,包括重金属、爵士、说唱等。


DEMO


文章里放不了太多的音频,我挑几个给大家听听,想看完整版的DEMO可以到这个链接里去看。


https://map-yue.github.io/


1、重金属



2、说唱


3、儿歌


4、粤语歌

技术特点


  1. 全歌曲生成:与传统的短音频生成不同,YuE可以生成完整的、数分钟长的歌曲,包含人声和伴奏,确保歌词与旋律的协调性。


  2. 创新的音频分词器:采用语义增强的音频分词器,有助于更精准地捕捉和生成音乐的细节。


  3. 双标记技术:通过双标记的方式,使得生成的歌曲在保持歌词一致性的同时,也能保留高质量的音乐性。


  4. 多样化风格生成:YuE支持多种音乐风格的生成,包括金属、爵士、说唱等,具备较强的风格适应性。


  5. 歌词思维链:结合歌词思维链技术,有助于在生成过程中更好地理解和表现歌词的情感与主题。


项目链接


https://github.com/multimodal-art-projection/YuE


 关注「开源AI项目落地」公众号

(文:开源AI项目落地)

欢迎分享

发表评论