OpenAI 对中国AI公司DeepSeek 发起指控!
OpenAI 最近向《金融时报》表示,他们发现了证据,证明中国AI初创公司 DeepSeek 在训练自己的开源竞品时,使用了 OpenAI 的专有模型。
这……这是怎么回事呢?
价值5890亿美元的蝴蝶效应
故事要从DeepSeek-R1模型说起。
这个仅用2048块英伟达H800显卡、耗资560万美元训练的中国模型,竟在推理能力榜单上打平o1,甚至在部分场景超越了尚未开放使用的o3!
更惊人的是,其训练成本仅为GPT-4的1/60。
而后果就是,在刚刚过去的周一,英伟达股价单日暴跌17%,市值蒸发5890亿美元。
虽然次日反弹9%,但AI硬件投资逻辑已被撕开裂缝,硅谷AI 泡沫似乎已吹弹可破。
「蒸馏」惹的祸?
事情的关键在于一个叫「蒸馏」的技术。
所谓蒸馏,就是开发者利用大型模型的输出来训练小型模型,让小模型以更低的成本获得类似的性能。
这本来是业内常见的做法。
但问题在于:DeepSeek 可能是在用这种方法训练自己的竞争模型,这明显违反了 OpenAI 的服务条款。
OpenAI 的一位知情人士表示:「关键在于你是否将其(模型输出)从平台中取出,用于创建自己的模型。」
「可疑」的低成本
DeepSeek 的表现确实令人惊讶。他们声称只用了:
-
2048块 Nvidia H800 显卡
-
花费560万美元
-
训练了一个有6710亿参数的V3模型
这些数字相比 OpenAI 和 Google 训练同等规模模型的投入,简直是九牛一毛!
这让业内专家都觉得蹊跷。
他们发现 DeepSeek 的模型响应暗示它可能是在 GPT-4 的输出上训练的,这显然违反了服务条款。
问题的复杂性
加州大学伯克利分校的 AI 博士候选人 Ritwik Gupta 指出:
「用商业LLM(如ChatGPT)的输出来训练另一个模型,在初创企业和学术界是很常见的做法。这样可以免费获得人类反馈的步骤。」
这也凸显出技术保护的难度。
OpenAI 在最新声明中表示:「我们知道中国的公司,以及其他公司,一直在试图蒸馏美国领先AI公司的模型。」
为此,OpenAI 正采取多项措施:
-
实施反制措施保护知识产权
-
谨慎决定在发布模型中包含哪些前沿功能
-
与美国政府密切合作,保护最强大的模型免受对手和竞争对手的窃取
美国前总统特朗普(上一任时的特朗普)的 AI 和加密货币顾问 David Sacks 也对此表态:
有实质性证据表明 DeepSeek 从 OpenAI 模型中蒸馏知识,我认为 OpenAI 对此非常不满。
矛盾点在于:如何界定技术借鉴与知识产权剽窃?
OpenAI与微软去年就封杀过疑似DeepSeek的API账号。
但有业内人士评论称:「要彻底杜绝这类操作,比在太平洋里捞针还难。」
有趣的是,OpenAI 自己也正面临来自《纽约时报》和知名作家的版权侵权诉讼。这些诉讼指控 OpenAI 在未经许可的情况下使用他们的文章和书籍来训练模型。
面对这场纷争,DeepSeek 尚未作出回应。
而此时恰逢中国农历新年假期。
有网友调侃:「这时间选得妙,是要过个糟心年吗?」
难以明辨的是:用大模型输出训练小模型,到底算技术创新还是技术剽窃?
这场围绕AI模型知识产权的争议,可能才刚刚开始。
(文:AGI Hunt)