中国AI再突破,全球首个音乐推理大模型Mureka O1诞生,超越Suno登顶SOTA|

会思考的AI已经席卷到了音乐领域,这一次,引领这场变革的,也是一家来自中国的公司——昆仑万维。

作者|伍月

编辑|栗子

生成式AI的发展已进入关键的应用落地阶段,AI正在从快速生成转向深度推理。更聪明的AI不仅会回答问题,还能在推理过程中深思熟虑地推理和解决问题。


2025年春节,DeepSeek R1惊艳全球,其突破性地将诺贝尔经济学奖得主卡尼曼提出的“慢思考”(System 2)理论工程化,通过动态思维链技术重构模型推理范式,不仅推动OpenAI被迫开放思维链功能,更标志着AI从“刺激-反应”的直觉型生成,正式进化为具备自主推理能力的认知主体。


当全球目光聚焦于文本领域的突破时,会思考的AI已经席卷到了音乐领域。这一次,引领这场变革的,也是一家来自中国的公司——昆仑万维。


3月26日,昆仑万维正式发布Mureka O1模型与Mureka V6模型。其中,Mureka O1作为全球首款音乐推理大模型,性能超越Suno、模型登顶SOTA。中国科技创新再次在AI音乐领域领跑全球。


具体来说,Mureka是昆仑万维在2024年发布的一款AI音乐产品。第一代音乐生成模型Mureka V1(SkyMusic)发布于2024年4月,目前基座模型已经迭代到第六版,也就是Mureka V6。而Mureka O1模型是基于Mureka V6的推理优化版本,也是全球范围内首个引入CoT的音乐模型。


经过「甲子光年」实际体验,具备推理能力的Mureka O1在实际效果上的确更加惊艳,也是此次Mureka模型更新的最大看点。


比如,输入相同的prompt给到Mureka O1和Suno V4,对比之下,Mureka O1生成的音乐在歌手声音质感、节奏、旋律上都明显更胜一筹。


输入同一prompt,对比Mureka O1和Suno V4生成音乐效果


在「甲子光年」看来,一场音乐创作革命正在发生:AI不只是辅助工具,而是能根据简单指令即兴写词,还能理解布鲁斯的忧郁蓝调曲风的智能创作伙伴。


如同DeepSeek在上线推理模型R1之后的爆火一样,今天Mureka O1的问世让我们感觉,AI音乐的“GPT时刻”正在到来。




1.Mureka O1 & Mureka V6一手实测:人人都能成为音乐创作者

前面提到,最新发布的Mureka O1模型是基于Mureka V6思维链的推理优化版本,而Mureka V6是当前Mureka的基座模型,支持纯音乐生成,还支持10种语言的AI音乐创作,包括英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语。


Mureka支持10种语言作曲,来源:Mureka官网


我们先来感受一下Mureka官方创作的作品demo。

Mureka O1和Mureka V6发布后的第一时间,「甲子光年」就进行了一手实测。


在对话框中输入“小巷人家”这四个字后,Mureka便自动生成了一段生动的文字,词句间洋溢着浓浓的烟火气息:“鸡鸣犬吠迎晨曦,日子悠然缓行,青石板路上苔痕碧绿,老树垂下斑驳树影。”


点击创作键,不出一会儿,一段两分半钟的音乐便缓缓流淌而出。


由Mureka生成的《大街小巷》音乐


目前,可以直接通过Mureka的网页端(官网界面:www.mureka.AI)体验Mureka O1和Mureka V6。


打开Mureka官网,可以直接到达创作页面。歌曲创作有简单模式和高级模式。高级模式下,输入你想创作的歌曲名称,可以直接让AI生成相应的歌词。


在模型界面,用户可以选择Mureka O1、Mureka V6和Mureka V5.5多个模型进行创作。


Mureka支持模型切换,来源:Mureka官网


曲风上,Mureka不仅可以支持“爵士(Jazz)、电子(Electronic)、流行(Pop)、乡村(Country)、节奏布鲁斯(R&B)、灵魂乐(Soul)、蓝调(Blues)、摇滚(Rock)、舞曲(Dance)”等,还能直接让用户上传参考歌曲,或者粘贴YouTube链接,让AI根据用户选择定向生成不同的曲风。在列表中可以看到,很多用户上传的歌曲列表。


用户上传参考歌曲,让Mureka生成相似曲风的音乐,来源:Mureka官网


词曲都设置完成后,就可以点击创作生成不同歌曲,每次Mureka都会生成两首不同的歌供选择。歌曲生成后,可以直接点击发布分享歌曲链接,还可以根据歌词让AI生成对应的视频。


音乐生成后支持下载、视频生成和发布,来源:Mureka官网


Mureka还推出了很多对于音乐工作创作者非常友好的功能。比如,Mureka不仅提供丰富的官方歌手音色选择,还允许用户上传自己的声音,通过AI学习和复刻,实现个性化音色定制。人人都能成为AI歌手的时代来临,每个人都能轻松创作出具有个人特色的音乐作品。


上传自己的声音,定制自己的专属音乐,来源:Mureka官网


歌曲生成后,用户也可以下载分轨音频和伴奏等,且能对音乐进行局部编辑,自定义自己想做的作品。


支持对歌曲的二次编辑,来源:Mureka官网


各种顺滑的体验之外,Mureka还搞了个大动作:开放API服务和模型微调功能。


Mureka是全球首批开放API服务的高质量AI音乐生成平台。更重要的是,不仅在全球范围内首次开放API服务,Mureka还同步开放基于Mureka V6的模型微调服务,成为全球首个开放模型微调功能的AI音乐生成平台。


来源:Mureka官网


面向企业和开发者,Mureka开放了两大类灵活的API服务,具体包括音乐音频生成API,还有语音合成API。


使用Mureka,音乐工作室就可以上传版权作品,训练专属厂牌风格模型。这意味着,音乐工作室和众多创业者可以直接通过Mureka API实现创作的工业化。


当游戏公司利用该API批量生成1000个NPC(非玩家角色)的专属背景音乐(BGM)时,音乐生产便真正融入了智能化的工作流之中。


之前,网友们调侃李荣浩词曲创作一手包办,一个人就是一支队伍。而现在,AI技术的发展正使得这样的个人全能现象变得更加普遍和可行。


音乐史上个人全能创作的时代正在逐步到来——零基础用户同样能够创作出热门单曲,独立音乐人正迎来黄金时代。




2.Mureka O1如何定义“音乐推理”?

DeepSeek R1的深度思考功能让很多人都感受到了思维链的魅力。如今,包括OpenAI的O1在内的很多语言模型都已经上线深度思考功能,让用户通过思维链(简称CoT)直观的看到大模型的动态思考推理过程。


实践证明,CoT能显著提升模型的推理能力,并促进模型的研究和迭代。


昆仑万维的Mureka团队开创性的把这种深度思考的“思维链(CoT)”能力引入了音乐生成模型上。在GitHub项目主页:MusiCoT.github.io,可以看到论文和项目介绍


https://arxiv.org/abs/2503.19611


MusiCoT利用了思维链Chain-of-Thought (CoT)方法,不同于传统自回归模型逐步生成音频,MusiCoT首次在细粒度音频token预测前预生成整体音乐结构,大幅提升生成音乐的结构连贯性与乐器编排精准度。


语言模型的CoT实践在跨领域方面并不是一项可以拿来即用的技术。因为传统的CoT方法通常是通过自然语言展示中间推理步骤,让AI像人一样,一步一步地解释它是怎么想的,然后得出结论。


但在音乐领域,音乐的情绪、节奏、旋律比较复杂,没办法像分析文字那样,一步步“思考”音乐。


Mureka团队的工程师们想出了个聪明的办法,为AI理解和生成音乐提供了一种新的“思考”方式。


传统的AI作曲方式,就像写日记一样,一个音符接一个音符地写,想到哪写到哪,没有整体规划。


Mureka团队引入了一种能”听懂”音乐的AI翻译器 CLAP模型,把一段旋律或节奏转化一串“数字指纹”,同时还使用了RVQ技术,像是一个“翻译官”,把复杂的“数字指纹”翻译成 AI 能够理解的“标签”。


RVQ的粗到细粒度标记化方法,就像是一个“分层翻译”的过程:先翻译出音乐的整体框架,比如歌曲的结构、主要旋律等,就像是画一个草图; 然后再逐步翻译出音乐的细节,比如具体的音符、节奏变化等,就像是在草图上添加细节。


Mureka自研基于MusiCoT的自回归模型音乐生成技术,来源:MusiCoT.github.io


如此,AI创作时,不再是生硬地拼凑音符,而是像音乐家那样,先开始“画蓝图”,想出一个大概的音乐结构,然后再慢慢细化,生成具体的音乐。


这是一种创新性的尝试,且这种方式方式更贴近人类的创作流程,有助于产生更具整体性和连贯性的音乐作品。


这样,Mureka O1就像一位不断打磨作品的作曲家,能够持续学习,不断推理,优化自己的创作能力。


在最新的音乐评测中,Mureka O1在最终的整体听感评测中已经超过了Suno V4,在总分为10分评测中,拿到了6.93分,且在声音质感和背景音乐质感上也超过了Suno V4。


Mureka O1在主观测评中整体听感超越Suno V4


此外,在客观评测中,在音乐连贯性、歌词发音准确度、文本相关性、作品复杂度和质量等维度上,Mureka O1表现明显超越Suno V4。


相同prompt下生成歌曲的横向对比


技术报告也显示,同一段prompt输入后,Mureka O1实现了行业领先的低延迟音乐生成。


Mureka O1实现了行业领先的低延时音乐生成


MusiCoT的创新技术实践,不仅在技术层面实现了突破,更加提升了音乐生成的质量和效率,让音乐成为成为更加普及、更加多元、更加个性化的表达方式。


通过引入AI的深度思考能力,很多人也能够生成超越人类固有思维模式的音乐作品,从而拓展音乐创作的边界,探索全新的音乐风格和表达方式。




3.AI音乐创作作曲革命:“智能创作大脑”重新定义音乐生产力

“Mureka”不仅仅是一个产品名,它也代表着在音乐的世界里,灵感抵达之际,创意的喷薄而出。它象征着一种顿悟,一种灵感迸发的瞬间,如同阿基米德在浴缸中发现浮力定律时喊出的“Eureka!”一样,充满了惊喜和激动。


这种灵感时刻,也恰如其分的隐含了MusiCoT的出现,让AI音乐呈现出了灵感与算法的共鸣。AI能够像人类一样,在音乐中表达情感和创意。


毋庸置疑,音乐创作将迎来巨变。


由于Mureka开放 API 服务和模型微调功能。开发者不仅可以将Mureka强大的AI音乐生成能力集成到各种应用程序和平台中;还可以据特定需求,对Mureka的AI模型进行个性化训练。任何音乐人都可以以极低的成本,用自己创作的版权音乐,训练属于自己的音乐模型。已经有游戏开发者在尝试,通过微调模型,使其生成特定游戏风格的背景音乐。即使没有专业的音乐知识和技能,用户也可以通过Mureka生成高质量的音乐作品。


对于个人创作者而言,Mureka降低了专业音乐制作门槛,让脑海中的“灵光一现”能够快速转化为作品,被更多人看见。更多人能够参与到音乐创作中来,用音乐表达自己的情感和想法。对于专业的音乐制作人而言,Mureka更是一个激发创意的平台,它能够为音乐人提供丰富的灵感和创意,帮助他们突破创作瓶颈。


比如输入prompt:love song,Mureka可以自动生成歌词,点击创作就生成了下面这首歌。



在更广阔的文娱和内容产业,AI音乐将会被广泛应用,对于游戏、影视、广告等领域而言,Mureka能够提供高效、高质量的配乐解决方案,缩短制作周期,降低制作成本,让创作者能够更专注于内容创作本身。更多崭新的音乐教育、音乐治疗、音乐娱乐等业态会诞生,为人们带来更加美好的音乐体验。


昆仑万维最新还发了一支《Mureka》的同名MV,歌曲由AI音乐人Mureka演唱,动画部分则由AI视频生成平台SkyReels制作,进一步展示了AI音乐与AI视频的融合潜力。



目前,Mureka产品已经在全球化100多个国家被使用。Mureka向「甲子光年」谈到他们的愿景:“音乐是情感表达最重要的手段之一,过去因为学习门槛过高,学习曲线过于陡峭,影响了人们使用音乐这一载体表达情感。AI 技术可以让人们更好的使用音乐这一手段表达自己的情感。”


Mureka在音乐生成领域的惊艳背后,依托的也是在大模型全产业链进行布局的昆仑万维。


昆仑万维是国内少数在AI领域全产业链布局的互联网大厂。


昆仑万维创始人周亚辉曾在朋友圈表示,昆仑万维的AI战略优势在于差异化,并强调公司找到了“小而大美的空间”。


此次,Mureka O1 & V6两个模型的上线,不仅向外界展示了昆仑万维在 AI 技术上卓越的创新能力,更印证了其“小而大美”战略的成功实践。


通过聚焦 AI 音乐生成这一细分领域,Mureka团队创新性地引入“思维链(CoT)”等技术,赋予 AI 更强的理解和创造力,实现了技术和应用的突破。


据团队透露,接下来,Mureka还将开发更多创新性的音乐创作功能,例如音乐生成的二次编辑、歌曲的创意再造等;同时也会积极拓展开发者生态和合作伙伴关系,通过开放平台和合作,构建一个充满活力和创新力的音乐创作社区。


从DeepSeek到Mureka,中国AI在认知架构上的突破并非孤立存在,而是密不可分的。DeepSeek在通用AI领域的突破,为Mureka在音乐领域的创新,提供了颇具借鉴意义的方向。Mureka的创新实践,是中国AI在认知架构突破的基础上,针对音乐领域进行深度探索和创新的成果。不仅展示了中国 AI 在垂直领域的技术实力,也为 AI 音乐的未来发展,开辟了新的道路。


Mureka让AI成为灵感之源,将音乐灵感的门扉向大众敞开,未来,随着AI技术的不断进步,音符在科技与艺术的交融中,将会绽放更加耀眼的光芒。


(封面图来源:昆仑万维)



(文:甲子光年)

欢迎分享

发表评论