
出品丨AI 科技大本营(ID:rgznai100)
AI 正渗透各行各业,前不久,一首由 AI 创作的歌曲火爆出圈,在短短几天内登上热歌榜单。AI 正在为音乐爱好者打开音乐创作之门。据 Fortune Business Insights 数据显示,2023年全球数字音频工作站(DAW, Digital Audio Workstation)市场规模高达约30亿美元,预计2026年约70%的DAW企业将使用AI技术辅助音乐创作。
人人都是音乐创作人的时代来临了!
《Mureka》AI 音乐人 MV 全网首发,歌手:Mureka;该作品由 AI 生成,其中音乐由 Mureka 生成,视频由 SkyReels 技术支持生成。
笔者打开 www.mureka.ai,只需简单几个提示词,点击创作,一分钟生成两个版本的歌曲:


点开这首《童年的夜晚》,旋律柔和动听,人声温柔真挚,咬字清晰,歌词很贴近提示词的风格,完全没有 AI 感,很不错。
将生成的歌曲下载下来后,小编发现它支持音轨分离下载。普通歌曲下载只有一条音轨,而Mureka 提供音乐生成的独立的人声、伴奏等多轨输出,比如鼓声、贝斯等,这样对编曲者来说无疑是二次创作的神器,方便用户后续混音。

什么?你说提示词生成是小case啦?来,上难度,点击高级模式,Mureka 平台一键“以曲生曲”,选择或上传参考的音频,Mureka 也能根据你想要的音乐生成新的音乐了。Mureka 还可以进行“音色克隆”,即使用指定歌手的音色来生成歌曲,例如让陈奕迅唱刘德华的歌,或者上传一段10秒自己的声音,一键生成个性化专属作品,每个人都能成为 AI 歌手“出道”了。
笔者指定歌手选择一段《舒克贝塔主题曲》,参考歌曲选择英文儿歌《TwinkleTwinkleLittleStar》,输入新歌名为《未来智星球》,点击生成歌词,再点击创作,最后生成全新歌曲:

提取舒克贝塔主题曲的人声,结合《TwinkleTwinkleLittleStar》欢快上扬旋律,生成的歌曲欢快轻松,风格很贴歌词,很有童年动漫主题曲那味了,不知道的还以为《舒克贝塔》换主题曲了。
下面是用陈奕迅的声音来生成新的歌曲,是不是以为 Eason 发新专辑了?
除了中文、英语外,想考考 AI 懂不懂其他语言?洒洒水啦,Mureka 比小编厉害多了,支持生成英语、中文、日语、韩语、法语、西班牙语、葡萄牙语、德语、意大利语和俄语这十种语言的歌曲,偶尔尝试创作不同语言的歌曲也不错。
例如输入“类似新裤子乐队《你要跳舞吗》风格的日语歌”,Mureka 生成的日文歌《青春的舞步》活力满满,欢快悦耳,Get 到新裤子的精髓了,日文歌词里还穿插一句中文的“你要跳舞吗?”,呼应原版紧扣题呀!
输入“创作一首法语香颂,注意体现法国传统音乐,歌词诗意、浪漫,音乐有钢琴、小提琴等经典乐器”,Mureka 生成一首十分浪漫的法语歌,彷佛一位面容精致的女士,正用深邃的眼睛注视着你,轻轻歌唱一个唯美的爱情故事:

输入“一首葡萄牙语的桑巴舞曲,歌词充满活力,容易上口,让人想跟着跳动起来,音乐有打击乐器、铜管乐器的设计”提示词,生成的这首桑巴,很上手呀:
体验一圈下来,细心的你可能发现了,小编生成的歌曲带”V6″、”O1″的标识,在页面里还可以选择切换模型:
这几款音乐模型有什么区别?背后有哪些黑科技来支撑它们生成如此惊艳的歌曲,小编跟大家详细说说。

超越 Suno,Mureka O1 上大分!
早在 2024 年 4 月,昆仑万维发布国内首个公开的 AI 音乐生成大模型 Mureka V1(SkyMusic),经过近一年的迭代更新,Mureka 又上新!3 月 26 日,昆仑万维发布两款最新大模型:Mureka O1、Mureka V6,表现亮眼。
Mureka V6 采用自研的ICL(in-context learning)技术,显著提升声场的开阔感,增强人声质感和混音效果,支持纯音乐生成和十种语言的歌曲生成。而 Mureka O1 是全球首个采用 CoT 技术音乐模型,O1系统以多语言音乐创作、场景化背景音乐生成和先进 AI 音乐编辑为核心功能,大大降低音乐创作门槛,全面重塑音乐创作范式。据悉,目前已有超过 100 个国家和地区的用户使用 Mureka。
为什么这么说?分享两组数据:
在最新的音乐评测中,Mureka O1 在最终的整体听感评测超过 Suno V4。其中乐器演奏法多样性和配器设计方面超越 Suno V4,Mureka O1 在音质、人声质感及 BGM 质感上做到提升,为用户高品质的音乐体验。

在客观评测中,Mureka O1 在发音唱对率、乐段准确率、文本相关度、制作质量等客观指标中,表现均比Suno V4 表现出色。从中我们看到,Mureka O1 已达到行业SOTA水准。
同一套歌词,对比 Mureka O1 和 Suno V4 实际生成效果, 是不是觉得 Mureka O1 的人声更跑满,乐器更丰富呢?

引入 CoT,Mureka O1 让人惊艳
Mureka O1 表现如此强劲,离不开这项创新黑科技——MusiCoT。在介绍 MusiCoT 之前,我们先简单介绍 CoT。之前我们在使用大语言模型时,通过系列提示词可引导模型逐步完成复杂的任务,这是通过“提示链”的方式来给模型提供思考路径,使模型能按照预定的方向进行推理和生成内容。而“思维链”(CoT)让模型模仿人类的思考过程,通过产生一系列中间推理步骤来解决问题,而不是直接给出答案。这种方法有助于提高模型在复杂问题上的表现,增加输出结果的准确性和可解释性。
Mureka O1 首次在音乐生成领域应用的 MusiCoT,便是利用思维链 CoT 的方式。据《Analyzable Chain-of-Musical-Thought Promptingfor High-Fidelity Music Generation》(项目主页:MusiCoT.github.io)记录,不同于传统自回归模型逐步生成音频,MusiCoT 首次在细粒度音频 token 预测前预生成整体音乐结构,大幅提升生成音乐的结构连贯性与乐器编排精准度,大大提升歌词旋律契合度、演唱准确性和艺术表现力,同时保持低延时音乐生成。MusiCoT 基于 CLAP 模型,无需人工标注即具备高扩展性,并显著提高了生成音乐的可解释性和质量。
如此一来,MusiCoT 可以大大提升音乐模型的表现。例如在音乐生成任务中,模型可以通过一系列中间步骤来决定一个乐句的发展方向、节奏变化或是和弦进行,从而使得最终生成的作品更加有逻辑性和情感表达力。又如可提高个性化定制能力,音乐模型可以根据用户偏好或特定风格的要求进行更为精细的调整,有助于生成更符合特定需求或风格的音乐作品。

开放 API,共创价值
如果你想更进一步定制更多音乐内容,Mureka 作为业内首批正式提供多种 API 服务的 AI 音乐生成工具,开发者可以直接调用 Mureka 的 API 生成歌曲,同时可以上传自己的私有数据微调模型,让模型生成符合数据特征风格的歌曲。通过开放 API,Mureka 与更多人共同探索大模型从“技术爆发”到“价值创造”,帮助大家拓展商业价值。
目前,Mureka 同时开放两大类灵活的 API 服务,不仅包括音乐音频生成 API,还有语音合成 API。音乐 API,包括标准音乐生成 API、精调私有曲库 API,适用于内容创作、游戏配乐、短视频等多场景应用,也能提供定制品牌音乐、个人专辑等能力;语音 API,包括 AI 语音播客、精品说话人、音色克隆等 API ,用于语音播客、预制精品音色语音合成、音色克隆等场景。
不仅首次开放 API 服务,Mureka 还放大招——全球首批开放模型微调功能,开放基于 Mureka V6 的模型微调服务。大家可以根据自己的数据来训练专属音乐模型,有效提升音乐创作效率。Mureka 将严格保密数据,不会用于训练 Mureka 基座模型和泄露给他人。
开放同共建,有朋远方来。大模型技术的发展从来不是一家企业、一个平台就能推动的。Mureka 通过开放 API 和模型微调功能,帮助更多音乐人、制作人、品牌和游戏开发者提供定制化的 AI 音乐解决方案,创造更大的价值,共建蓬勃的 AI 音乐开发者生态。
从本次 Mureka 的全新升级来看,诸多音乐生成领域的技术创新均走在世界前沿:MusiCoT、开放 API 平台和模型微调。这来源于昆仑万维的战略,早在 2023 年 4 月,昆仑万维在 2022 年年度业绩报告提到:展望未来十年,昆仑万维将坚定的“All in”AGI 与AIGC。在 2024 年 1月,昆仑万维发布全新使命“实现通用人工智能,让每个人更好地塑造和表达自我”。
昆仑万维创始人周亚辉表示:“未来三十年,人类社会将从感知线,变成表达线,整个人类社会在自我表达侧要翻1000倍;创作和自我表达是未来30年在整个社交和文化领域增长最快的曲线,会有越来越多人表达自我,表达对世界的理解、对社会事物的态度,表达越来越艺术化和趣味化;这种表达在过去很困难,因为工具门槛高,而未来30年是自我表达的30年,我们要用AI把人类创作的门槛降得足够低,让人们更充分地实现自我表达。”
【活动分享】2025 全球机器学习技术大会(ML-Summit)将于 4 月 18-19 日在上海举办。大会共 12 大主题、50+ 位来自学术界和一线技术实战派的顶尖专家,聚焦下一代大模型技术和生态变革技术实践。详情参考官网:http://ml-summit.org/。

(文:AI科技大本营)