会思考的AI已经席卷到了音乐领域，这一次，引领这场变革的，也是一家来自中国的公司——昆仑万维。

作者｜伍月‍‍

编辑｜栗子‍‍

生成式AI的发展已进入关键的应用落地阶段，AI正在从快速生成转向深度推理。更聪明的AI不仅会回答问题，还能在推理过程中深思熟虑地推理和解决问题。

2025年春节，DeepSeek R1惊艳全球，其突破性地将诺贝尔经济学奖得主卡尼曼提出的“慢思考”（System 2）理论工程化，通过动态思维链技术重构模型推理范式，不仅推动OpenAI被迫开放思维链功能，更标志着AI从“刺激-反应”的直觉型生成，正式进化为具备自主推理能力的认知主体。

当全球目光聚焦于文本领域的突破时，会思考的AI已经席卷到了音乐领域。这一次，引领这场变革的，也是一家来自中国的公司——昆仑万维。

3月26日，昆仑万维正式发布Mureka O1模型与Mureka V6模型。其中，Mureka O1作为全球首款音乐推理大模型，性能超越Suno、模型登顶SOTA。中国科技创新再次在AI音乐领域领跑全球。

具体来说，Mureka是昆仑万维在2024年发布的一款AI音乐产品。第一代音乐生成模型Mureka V1（SkyMusic）发布于2024年4月，目前基座模型已经迭代到第六版，也就是Mureka V6。而Mureka O1模型是基于Mureka V6的推理优化版本，也是全球范围内首个引入CoT的音乐模型。

经过「甲子光年」实际体验，具备推理能力的Mureka O1在实际效果上的确更加惊艳，也是此次Mureka模型更新的最大看点。

比如，输入相同的prompt给到Mureka O1和Suno V4，对比之下，Mureka O1生成的音乐在歌手声音质感、节奏、旋律上都明显更胜一筹。

输入同一prompt，对比Mureka O1和Suno V4生成音乐效果

在「甲子光年」看来，一场音乐创作革命正在发生：AI不只是辅助工具，而是能根据简单指令即兴写词，还能理解布鲁斯的忧郁蓝调曲风的智能创作伙伴。

如同DeepSeek在上线推理模型R1之后的爆火一样，今天Mureka O1的问世让我们感觉，AI音乐的“GPT时刻”正在到来。

1.Mureka O1 & Mureka V6一手实测：人人都能成为音乐创作者

前面提到，最新发布的Mureka O1模型是基于Mureka V6思维链的推理优化版本，而Mureka V6是当前Mureka的基座模型，支持纯音乐生成，还支持10种语言的AI音乐创作，包括英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语。

Mureka支持10种语言作曲，来源：Mureka官网

我们先来感受一下Mureka官方创作的作品demo。

Mureka O1和Mureka V6发布后的第一时间，「甲子光年」就进行了一手实测。

在对话框中输入“小巷人家”这四个字后，Mureka便自动生成了一段生动的文字，词句间洋溢着浓浓的烟火气息：“鸡鸣犬吠迎晨曦，日子悠然缓行，青石板路上苔痕碧绿，老树垂下斑驳树影。”

点击创作键，不出一会儿，一段两分半钟的音乐便缓缓流淌而出。

由Mureka生成的《大街小巷》音乐

目前，可以直接通过Mureka的网页端（官网界面：www.mureka.AI）体验Mureka O1和Mureka V6。

打开Mureka官网，可以直接到达创作页面。歌曲创作有简单模式和高级模式。高级模式下，输入你想创作的歌曲名称，可以直接让AI生成相应的歌词。

在模型界面，用户可以选择Mureka O1、Mureka V6和Mureka V5.5多个模型进行创作。

Mureka支持模型切换，来源：Mureka官网

曲风上，Mureka不仅可以支持“爵士(Jazz)、电子(Electronic)、流行(Pop)、乡村(Country)、节奏布鲁斯(R&B)、灵魂乐(Soul)、蓝调(Blues)、摇滚(Rock)、舞曲(Dance)”等，还能直接让用户上传参考歌曲，或者粘贴YouTube链接，让AI根据用户选择定向生成不同的曲风。在列表中可以看到，很多用户上传的歌曲列表。

用户上传参考歌曲，让Mureka生成相似曲风的音乐，来源：Mureka官网

词曲都设置完成后，就可以点击创作生成不同歌曲，每次Mureka都会生成两首不同的歌供选择。歌曲生成后，可以直接点击发布分享歌曲链接，还可以根据歌词让AI生成对应的视频。

音乐生成后支持下载、视频生成和发布，来源：Mureka官网

Mureka还推出了很多对于音乐工作创作者非常友好的功能。比如，Mureka不仅提供丰富的官方歌手音色选择，还允许用户上传自己的声音，通过AI学习和复刻，实现个性化音色定制。人人都能成为AI歌手的时代来临，每个人都能轻松创作出具有个人特色的音乐作品。

上传自己的声音，定制自己的专属音乐，来源：Mureka官网

歌曲生成后，用户也可以下载分轨音频和伴奏等，且能对音乐进行局部编辑，自定义自己想做的作品。

支持对歌曲的二次编辑，来源：Mureka官网

各种顺滑的体验之外，Mureka还搞了个大动作：开放API服务和模型微调功能。

Mureka是全球首批开放API服务的高质量AI音乐生成平台。更重要的是，不仅在全球范围内首次开放API服务，Mureka还同步开放基于Mureka V6的模型微调服务，成为全球首个开放模型微调功能的AI音乐生成平台。

来源：Mureka官网

面向企业和开发者，Mureka开放了两大类灵活的API服务，具体包括音乐音频生成API，还有语音合成API。

使用Mureka，音乐工作室就可以上传版权作品，训练专属厂牌风格模型。这意味着，音乐工作室和众多创业者可以直接通过Mureka API实现创作的工业化。

当游戏公司利用该API批量生成1000个NPC（非玩家角色）的专属背景音乐（BGM）时，音乐生产便真正融入了智能化的工作流之中。

之前，网友们调侃李荣浩词曲创作一手包办，一个人就是一支队伍。而现在，AI技术的发展正使得这样的个人全能现象变得更加普遍和可行。

音乐史上个人全能创作的时代正在逐步到来——零基础用户同样能够创作出热门单曲，独立音乐人正迎来黄金时代。

2.Mureka O1如何定义“音乐推理”？

DeepSeek R1的深度思考功能让很多人都感受到了思维链的魅力。如今，包括OpenAI的O1在内的很多语言模型都已经上线深度思考功能，让用户通过思维链（简称CoT）直观的看到大模型的动态思考推理过程。

实践证明，CoT能显著提升模型的推理能力，并促进模型的研究和迭代。

昆仑万维的Mureka团队开创性的把这种深度思考的“思维链（CoT）”能力引入了音乐生成模型上。在GitHub项目主页：MusiCoT.github.io，可以看到论文和项目介绍。

https://arxiv.org/abs/2503.19611

MusiCoT利用了思维链Chain-of-Thought （CoT）方法，不同于传统自回归模型逐步生成音频，MusiCoT首次在细粒度音频token预测前预生成整体音乐结构，大幅提升生成音乐的结构连贯性与乐器编排精准度。

语言模型的CoT实践在跨领域方面并不是一项可以拿来即用的技术。因为传统的CoT方法通常是通过自然语言展示中间推理步骤，让AI像人一样，一步一步地解释它是怎么想的，然后得出结论。

但在音乐领域，音乐的情绪、节奏、旋律比较复杂，没办法像分析文字那样，一步步“思考”音乐。

Mureka团队的工程师们想出了个聪明的办法，为AI理解和生成音乐提供了一种新的“思考”方式。

传统的AI作曲方式，就像写日记一样，一个音符接一个音符地写，想到哪写到哪，没有整体规划。

Mureka团队引入了一种能”听懂”音乐的AI翻译器 CLAP模型，把一段旋律或节奏转化一串“数字指纹”，同时还使用了RVQ技术，像是一个“翻译官”，把复杂的“数字指纹”翻译成 AI 能够理解的“标签”。

RVQ的粗到细粒度标记化方法，就像是一个“分层翻译”的过程：先翻译出音乐的整体框架，比如歌曲的结构、主要旋律等，就像是画一个草图；然后再逐步翻译出音乐的细节，比如具体的音符、节奏变化等，就像是在草图上添加细节。

Mureka自研基于MusiCoT的自回归模型音乐生成技术，来源：MusiCoT.github.io

如此，AI创作时，不再是生硬地拼凑音符，而是像音乐家那样，先开始“画蓝图”，想出一个大概的音乐结构，然后再慢慢细化，生成具体的音乐。

这是一种创新性的尝试，且这种方式方式更贴近人类的创作流程，有助于产生更具整体性和连贯性的音乐作品。

这样，Mureka O1就像一位不断打磨作品的作曲家，能够持续学习，不断推理，优化自己的创作能力。

在最新的音乐评测中，Mureka O1在最终的整体听感评测中已经超过了Suno V4，在总分为10分评测中，拿到了6.93分，且在声音质感和背景音乐质感上也超过了Suno V4。

Mureka O1在主观测评中整体听感超越Suno V4

此外，在客观评测中，在音乐连贯性、歌词发音准确度、文本相关性、作品复杂度和质量等维度上，Mureka O1表现明显超越Suno V4。

相同prompt下生成歌曲的横向对比

技术报告也显示，同一段prompt输入后，Mureka O1实现了行业领先的低延迟音乐生成。

Mureka O1实现了行业领先的低延时音乐生成

MusiCoT的创新技术实践，不仅在技术层面实现了突破，更加提升了音乐生成的质量和效率，让音乐成为成为更加普及、更加多元、更加个性化的表达方式。

通过引入AI的深度思考能力，很多人也能够生成超越人类固有思维模式的音乐作品，从而拓展音乐创作的边界，探索全新的音乐风格和表达方式。

3.AI音乐创作作曲革命：“智能创作大脑”重新定义音乐生产力

“Mureka”不仅仅是一个产品名，它也代表着在音乐的世界里，灵感抵达之际，创意的喷薄而出。它象征着一种顿悟，一种灵感迸发的瞬间，如同阿基米德在浴缸中发现浮力定律时喊出的“Eureka！”一样，充满了惊喜和激动。

这种灵感时刻，也恰如其分的隐含了MusiCoT的出现，让AI音乐呈现出了灵感与算法的共鸣。AI能够像人类一样，在音乐中表达情感和创意。

毋庸置疑，音乐创作将迎来巨变。

由于Mureka开放 API 服务和模型微调功能。开发者不仅可以将Mureka强大的AI音乐生成能力集成到各种应用程序和平台中；还可以据特定需求，对Mureka的AI模型进行个性化训练。任何音乐人都可以以极低的成本，用自己创作的版权音乐，训练属于自己的音乐模型。已经有游戏开发者在尝试，通过微调模型，使其生成特定游戏风格的背景音乐。即使没有专业的音乐知识和技能，用户也可以通过Mureka生成高质量的音乐作品。

对于个人创作者而言，Mureka降低了专业音乐制作门槛，让脑海中的“灵光一现”能够快速转化为作品，被更多人看见。更多人能够参与到音乐创作中来，用音乐表达自己的情感和想法。对于专业的音乐制作人而言，Mureka更是一个激发创意的平台，它能够为音乐人提供丰富的灵感和创意，帮助他们突破创作瓶颈。

比如输入prompt：love song，Mureka可以自动生成歌词，点击创作就生成了下面这首歌。

在更广阔的文娱和内容产业，AI音乐将会被广泛应用，对于游戏、影视、广告等领域而言，Mureka能够提供高效、高质量的配乐解决方案，缩短制作周期，降低制作成本，让创作者能够更专注于内容创作本身。更多崭新的音乐教育、音乐治疗、音乐娱乐等业态会诞生，为人们带来更加美好的音乐体验。

昆仑万维最新还发了一支《Mureka》的同名MV，歌曲由AI音乐人Mureka演唱，动画部分则由AI视频生成平台SkyReels制作，进一步展示了AI音乐与AI视频的融合潜力。

目前，Mureka产品已经在全球化100多个国家被使用。Mureka向「甲子光年」谈到他们的愿景：“音乐是情感表达最重要的手段之一，过去因为学习门槛过高，学习曲线过于陡峭，影响了人们使用音乐这一载体表达情感。AI 技术可以让人们更好的使用音乐这一手段表达自己的情感。”

Mureka在音乐生成领域的惊艳背后，依托的也是在大模型全产业链进行布局的昆仑万维。

昆仑万维是国内少数在AI领域全产业链布局的互联网大厂。

昆仑万维创始人周亚辉曾在朋友圈表示，昆仑万维的AI战略优势在于差异化，并强调公司找到了“小而大美的空间”。

此次，Mureka O1 & V6两个模型的上线，不仅向外界展示了昆仑万维在 AI 技术上卓越的创新能力，更印证了其“小而大美”战略的成功实践。

通过聚焦 AI 音乐生成这一细分领域，Mureka团队创新性地引入“思维链（CoT）”等技术，赋予 AI 更强的理解和创造力，实现了技术和应用的突破。

据团队透露，接下来，Mureka还将开发更多创新性的音乐创作功能，例如音乐生成的二次编辑、歌曲的创意再造等；同时也会积极拓展开发者生态和合作伙伴关系，通过开放平台和合作，构建一个充满活力和创新力的音乐创作社区。

从DeepSeek到Mureka，中国AI在认知架构上的突破并非孤立存在，而是密不可分的。DeepSeek在通用AI领域的突破，为Mureka在音乐领域的创新，提供了颇具借鉴意义的方向。Mureka的创新实践，是中国AI在认知架构突破的基础上，针对音乐领域进行深度探索和创新的成果。不仅展示了中国 AI 在垂直领域的技术实力，也为 AI 音乐的未来发展，开辟了新的道路。

Mureka让AI成为灵感之源，将音乐灵感的门扉向大众敞开，未来，随着AI技术的不断进步，音符在科技与艺术的交融中，将会绽放更加耀眼的光芒。

（封面图来源：昆仑万维）

（文：甲子光年）

一	二	三	四	五	六	日
	1	2	3	4	5	6
7	8	9	10	11	12	13
14	15	16	17	18	19	20
21	22	23	24	25	26	27
28	29	30	31

中国AI再突破，全球首个音乐推理大模型Mureka O1诞生，超越Suno登顶SOTA｜

1.Mureka O1 & Mureka V6一手实测：人人都能成为音乐创作者

2.Mureka O1如何定义“音乐推理”？

3.AI音乐创作作曲革命：“智能创作大脑”重新定义音乐生产力

发表评论取消回复

1.Mureka O1 & Mureka V6一手实测：人人都能成为音乐创作者

2.Mureka O1如何定义“音乐推理”？

3.AI音乐创作作曲革命：“智能创作大脑”重新定义音乐生产力

发表评论 取消回复

发表评论取消回复