OpenAI 称有证据证明DeepSeek违规使用其模型！

OpenAI 对中国AI公司DeepSeek 发起指控！

OpenAI 最近向《金融时报》表示，他们发现了证据，证明中国AI初创公司 DeepSeek 在训练自己的开源竞品时，使用了 OpenAI 的专有模型。

这……这是怎么回事呢？

价值5890亿美元的蝴蝶效应

故事要从DeepSeek-R1模型说起。

这个仅用2048块英伟达H800显卡、耗资560万美元训练的中国模型，竟在推理能力榜单上打平o1，甚至在部分场景超越了尚未开放使用的o3！

更惊人的是，其训练成本仅为GPT-4的1/60。

而后果就是，在刚刚过去的周一，英伟达股价单日暴跌17%，市值蒸发5890亿美元。

虽然次日反弹9%，但AI硬件投资逻辑已被撕开裂缝，硅谷AI 泡沫似乎已吹弹可破。

事情的关键在于一个叫「蒸馏」的技术。

所谓蒸馏，就是开发者利用大型模型的输出来训练小型模型，让小模型以更低的成本获得类似的性能。

这本来是业内常见的做法。

但问题在于：DeepSeek 可能是在用这种方法训练自己的竞争模型，这明显违反了 OpenAI 的服务条款。

OpenAI 的一位知情人士表示：「关键在于你是否将其（模型输出）从平台中取出，用于创建自己的模型。」

DeepSeek 的表现确实令人惊讶。他们声称只用了：

这些数字相比 OpenAI 和 Google 训练同等规模模型的投入，简直是九牛一毛！

这让业内专家都觉得蹊跷。

他们发现 DeepSeek 的模型响应暗示它可能是在 GPT-4 的输出上训练的，这显然违反了服务条款。

加州大学伯克利分校的 AI 博士候选人 Ritwik Gupta 指出：

「用商业LLM（如ChatGPT）的输出来训练另一个模型，在初创企业和学术界是很常见的做法。这样可以免费获得人类反馈的步骤。」

这也凸显出技术保护的难度。

OpenAI 在最新声明中表示：「我们知道中国的公司，以及其他公司，一直在试图蒸馏美国领先AI公司的模型。」

为此，OpenAI 正采取多项措施：

美国前总统特朗普（上一任时的特朗普）的 AI 和加密货币顾问 David Sacks 也对此表态：

有实质性证据表明 DeepSeek 从 OpenAI 模型中蒸馏知识，我认为 OpenAI 对此非常不满。

矛盾点在于：如何界定技术借鉴与知识产权剽窃？

OpenAI与微软去年就封杀过疑似DeepSeek的API账号。

但有业内人士评论称：「要彻底杜绝这类操作，比在太平洋里捞针还难。」

有趣的是，OpenAI 自己也正面临来自《纽约时报》和知名作家的版权侵权诉讼。这些诉讼指控 OpenAI 在未经许可的情况下使用他们的文章和书籍来训练模型。

面对这场纷争，DeepSeek 尚未作出回应。

而此时恰逢中国农历新年假期。

有网友调侃：「这时间选得妙，是要过个糟心年吗？」

难以明辨的是：用大模型输出训练小模型，到底算技术创新还是技术剽窃？

这场围绕AI模型知识产权的争议，可能才刚刚开始。

（文：AGI Hunt）