近日,法国流媒体平台Deezer推出全新工具,旨在打击其所谓的“AI生成歌曲泛滥现象”。该平台将对检测到含有全AI生成歌曲的专辑进行标注,为用户提供更透明的服务体验。

这是Deezer针对平台上AI生成音乐激增现象发布的最新举措。据该公司透露,在全AI生成的曲目中,高达70%的流量被认定为欺诈性或人为刷量。这种标注工具是Deezer应对AI音乐冲击的系列行动之一,平台认为此类内容正在造成实质性损害。
Deezer 在 1 月首次发出警报,当时该公司报告称其专有的 AI 检测工具发现,每天上传到 Deezer 的歌曲中有 10% 是完全由 AI 生成的。虽然该公司表示,他们并不反对人类艺术家将 AI 作为创作过程的一部分,但完全由 AI 生成的歌曲往往被用来在平台上发布垃圾信息,或者从人类艺术家那里窃取版税。为应对这一问题,Deezer 开始将完全由 AI 生成的歌曲从其推荐列表中移除。

在 4 月,Deezer 声称这一比例几乎翻了一番,报告称每天的上传中有 18% 是完全由 AI 生成的。在与《公告牌》杂志的一次新访谈中,Deezer 研究总监 Manuel Moussallam 将这一增长归因于两个关键原因:像 Suno 和 Udio 这样的 AI 音乐工具的进一步采用;以及,简单地说,“我们的数据变得更好了”。
“我们在 1 月识别为 AI 生成的部分内容,我们当时并不完全确定,因此我们在报告的数字上非常保守。我们不希望有任何误报,”Moussallam 解释说。“我认为 18% 的数字实际上更准确,更接近我们从 1 月实际看到的情况,但即便如此,这个数字仍在增加。”

尽管大多数竞争对手尚未对 AI 生成的音乐采取公开立场,或制定任何专门解决其可能带来的问题的规则,但 Deezer 认为无法忽视正在发生的事情。在与《公告牌》杂志的一次新访谈中,首席创新官 Aurelien Herault 与 Moussallam 一起解释说,时间正在流逝:“在某个时刻,整个行业将不得不对这个问题做出决定,因为 AI 音乐现在将永远存在。没有回头路可走。”

你们之前都说过,你们的团队在 Deezer 推出规则之前,与音乐界就正在制定的规则进行了很多讨论。你们是否与像 Suno 或 Udio 这样的 AI 公司进行过类似的对话?
Herault:没有正式进行。我们与那里的一些研究人员有联系,因为我们参加相同的会议,但不,我们没有进行接触。实际上,我认为他们并不太关心我们能否检测到他们的输出,因为问题出在我们这边,因为人们正在大量使用这些工具来在我们的目录中发布垃圾信息。

你是否开始看到人们使用 AI 内容进行垃圾信息传播的模式?例如,大多数人是否在创建多个账户并在它们之间切换以分散他们的大量上传?他们是否在人为地增加播放量?
Herault:我可以告诉你的是,他们很有创造力。
Moussallam:嗯,在音乐方面不算有创造力,但在垃圾信息方面?很有创造力。
Herault:我们最初担心 AI 生成音乐的原因是,它与我们已经看到的欺诈行为非常接近。你会创建大量账户。你每天上传大量的专辑。
Moussallam:我想,也许我们从 AI 音乐中看到的唯一新现象是它也可以被用于冒充。你找一个播放量很大的艺术家,然后试图创作出类似该艺术家风格的作品。这在我们这边相当令人担忧。
Herault:他们甚至试图在官方艺术家页面上发布这些歌曲。这就是为什么将我们的 AI 努力与我们的欺诈检测系统结合起来以避免这种行为很重要。

让我们回到最初发现有大量 AI 生成内容被上传到 Deezer 的时候,以及你们为什么决定在公司内部投入如此多的时间和资源来解决这个问题。
Moussallam:我想这可以追溯到 2022 年,当时科学界首次发布了第一批大型开源生成模型。这比商业模型可用之前要早,我们有机会自己尝试一下。随着时间的推移,我们开始看到这些模型的发展势头。很快,它们就能生成完整的歌曲,这在几年前还是不可能的。

显然,当 Suno 推出时,这是一个巨大的时刻。我们做的第一件事就是去该平台下载一些人们在那里分享的歌曲,然后,利用音频指纹技术,我们能够检查是否有人也将这些 AI 歌曲分发到我们的曲目库中。我们很快发现,是的,有人这么做了。当时,我们还不清楚数量有多少,但我们知道这种情况正在发生。对我们来说,量化这一现象非常重要,这促使我们真正开始研究它。
经过几个月的努力,我们终于找到了一种方法来确定规模。最终,我们在一月份有足够的信心公布了这个数字。我们进行了大量的双重检查,以确保不会有太多的误报。我们知道这将是一个巨大的问题。只有当我们有信心时,我们才会向公众传达。

Herault:今天,我们在谈论 AI 检测,但我们已经在 Deezer 上看到了其他类型内容的垃圾信息和人为播放行为,比如公有领域的歌曲、噪音和雨声。因此,我们在 AI 出现之前就已经开发了工具来了解我们平台上的内容。这已经是 12 年的研究和开发了,这就是为什么当出现新发展时,我们能够迅速做出反应。

我经常听到关于市场上声称能够检测 AI 生成音乐的产品的褒贬不一的评价——更不用说那些声称能够将 AI 生成音乐追溯到训练数据中启发它的歌曲的产品了。我想你们肯定也遇到过人们对你们工具的有效性表示怀疑的情况。你们是如何向他们保证其准确性的呢?
Herault:我们向音乐产业做了很多展示,展示我们的成果。我们还在科学界发表了一篇论文,所以每个人都可以查阅。
Moussallam:在我们发表的第一篇论文中,我们指出这个问题无法完全通过我们的工具解决。如果有什么的话,我们对自己的技术最为怀疑,因为我们做了这项工作——我们确切地知道它有多局限。这仍然是一个有待解决的问题,而且仍然很容易绕过我们的检测器。
Herault:这就是为什么我们要分享数据。我们希望展开讨论。我们向业界解释说,我们无法解决所有问题,但我们可以用这些工具解决部分问题。

目前 AI 音乐归属的可行性如何?
Moussallam:我们无法确定是否能够做到这一点。这是一个发展迅速且令人兴奋的领域,所以我们想深入研究。但这可能需要数年时间。我唯一确定的是,目前没有任何现成的产品能够令人满意地做到这一点。

我在音乐科技界听到的一个争论是,大量 AI 生成音乐是否会对流媒体服务构成严重负担,无论是从服务器还是存储空间方面来看。一位竞争对手音乐流媒体公司的员工告诉我,他们不认为这是一个真正的问题。其他人则认为这是。你们的看法是什么?
Herault:这是一个对我们来说很严肃的话题,我们已经移除了一些占用太多空间的内容——因为这不仅是一个经济问题,也是一个生态问题。我们是否需要存储所有这些内容,以便我们都有相同的曲目库,都拥有相同内容的副本?这确实是一个值得思考的问题,我们已经就移除部分内容进行了一些讨论,特别是因为大量内容根本无人收听。

听起来流媒体服务将不得不面对这个问题。
Herault:不仅仅是音乐流媒体,我是说,有各种各样的 AI 生成内容——图像、音频、视频。什么都有。
Moussallam:实际上,与电影或某些图像相比,音频并不是一个很大的文件,用于存储时。

我一直在想,年轻一代是否会关心他们的音乐是来自 AI 模型还是人类。对我们来说很难理解,但如果这些孩子是在 AI 内容的环境中长大的,也许他们的收听习惯与我们不同。在决定 Deezer 如何处理 AI 音乐时,你们是否考虑了这一点?
Moussallam:这是一个很棒的研究问题,但目前还没有答案。我认为很多人都在思考,我们是否看到了人们与音乐关系的转变。这也提出了一个问题,即人们最初为什么喜欢音乐?你需要与音乐有直接或间接的人际关系,才能赋予它意义吗?我相信很多人需要这种关系。但我不确定未来人们会怎么做。
(文:AI音频时代)