OpenAI 称有证据证明DeepSeek违规使用其模型!

OpenAI 对中国AI公司DeepSeek 发起指控!

OpenAI 最近向《金融时报》表示,他们发现了证据,证明中国AI初创公司 DeepSeek 在训练自己的开源竞品时,使用了 OpenAI 的专有模型。

这……这是怎么回事呢?

价值5890亿美元的蝴蝶效应

故事要从DeepSeek-R1模型说起。

这个仅用2048块英伟达H800显卡、耗资560万美元训练的中国模型,竟在推理能力榜单上打平o1,甚至在部分场景超越了尚未开放使用的o3!

更惊人的是,其训练成本仅为GPT-4的1/60

而后果就是,在刚刚过去的周一,英伟达股价单日暴跌17%,市值蒸发5890亿美元。

虽然次日反弹9%,但AI硬件投资逻辑已被撕开裂缝,硅谷AI 泡沫似乎已吹弹可破。

「蒸馏」惹的祸?

事情的关键在于一个叫「蒸馏」的技术。

所谓蒸馏,就是开发者利用大型模型的输出来训练小型模型,让小模型以更低的成本获得类似的性能。

这本来是业内常见的做法。

但问题在于:DeepSeek 可能是在用这种方法训练自己的竞争模型,这明显违反了 OpenAI 的服务条款

OpenAI 的一位知情人士表示:「关键在于你是否将其(模型输出)从平台中取出,用于创建自己的模型。」

「可疑」的低成本

DeepSeek 的表现确实令人惊讶。他们声称只用了:

  • 2048块 Nvidia H800 显卡

  • 花费560万美元

  • 训练了一个有6710亿参数的V3模型

这些数字相比 OpenAI 和 Google 训练同等规模模型的投入,简直是九牛一毛!

这让业内专家都觉得蹊跷。

他们发现 DeepSeek 的模型响应暗示它可能是在 GPT-4 的输出上训练的,这显然违反了服务条款。

问题的复杂性

加州大学伯克利分校的 AI 博士候选人 Ritwik Gupta 指出:

用商业LLM(如ChatGPT)的输出来训练另一个模型,在初创企业和学术界是很常见的做法。这样可以免费获得人类反馈的步骤。

这也凸显出技术保护的难度。

OpenAI 在最新声明中表示:「我们知道中国的公司,以及其他公司,一直在试图蒸馏美国领先AI公司的模型。」

为此,OpenAI 正采取多项措施:

  • 实施反制措施保护知识产权

  • 谨慎决定在发布模型中包含哪些前沿功能

  • 与美国政府密切合作,保护最强大的模型免受对手和竞争对手的窃取

美国前总统特朗普(上一任时的特朗普)的 AI 和加密货币顾问 David Sacks 也对此表态:

有实质性证据表明 DeepSeek 从 OpenAI 模型中蒸馏知识,我认为 OpenAI 对此非常不满。

矛盾点在于:如何界定技术借鉴与知识产权剽窃?

OpenAI与微软去年就封杀过疑似DeepSeek的API账号。

但有业内人士评论称:「要彻底杜绝这类操作,比在太平洋里捞针还难。

有趣的是,OpenAI 自己也正面临来自《纽约时报》和知名作家的版权侵权诉讼。这些诉讼指控 OpenAI 在未经许可的情况下使用他们的文章和书籍来训练模型。

面对这场纷争,DeepSeek 尚未作出回应。

而此时恰逢中国农历新年假期。

有网友调侃:「这时间选得妙,是要过个糟心年吗?」

难以明辨的是:用大模型输出训练小模型,到底算技术创新还是技术剽窃?

这场围绕AI模型知识产权的争议,可能才刚刚开始。

(文:AGI Hunt)

欢迎分享

发表评论