跳至内容
春节期间,一场关于 DeepSeek 的风波正在 AI 圈掀起波澜。
据彭博社最新报道,微软安全研究人员在去年秋天发现,一些可能与 DeepSeek 相关的个人通过 OpenAI 的 API 大规模提取数据。
知情人士透露,作为 OpenAI 的技术合作伙伴和最大金主,微软在发现这一情况后立即通知了 OpenAI。
报道称,这种行为可能违反 OpenAI 的服务条款。因为 OpenAI 的服务条款明确规定,用户不得未经授权使用自动化或程序化方法从其服务中提取数据。
即使 DeepSeek 获得了某种形式的 API 访问权限,但如果其使用方式超出了 OpenAI 授权的范围,比如用于非法或未经授权的商业目的,也可能被视为违反服务条款。
对于相关置评请求,OpenAI 未作回应,微软拒绝评论,而 DeepSeek 方也暂未回应。
值得一提的是,此前许多外界人士认为通过模型蒸馏技术,DeepSeek可能在训练过程中使用了 ChatGPT 等模型的输出数据作为训练材料,而这些数据中的「知识」被迁移到 DeepSeek 自己的模型中。
但质疑者关注的是 DeepSeek 是否在未充分披露的情况下使用了 OpenAI 模型的输出数据。这似乎在 DeepSeek-V3 的自我认知上也有所体现。
早前就有用户发现,当询问模型的身份时,它会将自己误认为是 GPT-4。
DeepSeek 团队在最新模型 R1 的技术报告中明确表示未使用 OpenAI 模型的输出数据,并表示通过强化学习和独特的训练策略实现了高性能。
例如,采用了多阶段训练方式,包括基础模型训练、强化学习(RL)训练、微调等,这种多阶段循环训练方式有助于模型在不同阶段吸收不同的知识和能力。
彭博社报道还指出,美国 AI 事务主管 David Sacks 近期在接受 Fox News 采访时表示,有「确凿证据」表明,DeepSeek 利用 OpenAI 模型的输出数据来开发自身技术。
不过,Sacks 并未提供具体的证据。近期,美国多名官员也表示 DeepSeek有「偷窃」嫌疑,正对其影响开展国家安全调查。
针对 David Sacks 的言论,OpenAI 的回应则比较保守。其发言人表示「我们知道,来自中国的公司以及其他一些企业,始终在尝试『蒸馏』美国领先 AI 公司的模型。」
该发言人强调,作为 AI 领域的领先者,OpenAI 已采取相应对策来保护其知识产权,其中包括对前沿能力的严格筛选,决定哪些功能可以公开发布。他们认为与美国政府密切合作对于保护最先进的 AI 模型至关重要。
就在这场争议风波持续发酵之际,外媒的目光也开始转向 DeepSeek 更早发布的开源 V3 模型,后者则通过技术报告详细披露了相关的深度底层优化细节。
据外媒扒出,V3 模型的开发甚至绕过了 CUDA,通过对英伟达 GPU 低级汇编语言 PTX 进行优化,从而实现了最大性能。
PTX 是英伟达 GPU 的中间指令集架构,能够实现寄存器分配、线程 / 线程束级别调整等细粒度优化。如果说 CUDA 是与英伟达 GPU 对话的「高级语言」,那么 PTX 就像是一种「机器底层语言」。
想象你在玩一个游戏机。通常情况下,我们只需要用手柄(就像 CUDA)就能玩游戏,这很方便,但可能无法发挥游戏机的全部实力。
而 PTX 就像是打开了游戏机的后盖,直接调整里面的各种配件和线路。虽然这样做很复杂,需要懂得很多专业知识,但是可以让游戏机跑得更快、性能更好。
更通俗的解释是,PTX 就是一种能够让开发者「掀开 GPU 的盖子」,直接调教其内部运作方式的工具。这就像是改装汽车,不是简单地踩油门,而是直接调教发动机的每个零件,以榨取最大性能。
DeepSeek 在训练 V3 模型时,对 H800 GPU 进行了重新配置,包括划分出 20 个 SM 用于服务器间通信,以及实现了流水线算法,优化能力远超常规 CUDA 开发水平。而倘若这一技术属实,或将撼动英伟达构筑已久的护城河。
不过,PTX 虽然能极大地优化性能,但也对开发团队提出了更高的要求。相比之下,英伟达的护城河 CUDA 凭借其开发便捷性和快速迭代的优势,仍然是大多数开发者的首选。
更重要的是,PTX 优化往往需要针对特定型号的硬件进行定制。
这种「量体裁衣」式的优化策略虽然效果显著,但也大大增加了开发难度和维护成本。这也解释了为什么在可预见的未来,CUDA 仍将在主流开发中占据主导地位。
但在既有规则之外寻求突破,往往就是颠覆的开始,DeepSeek 这次在海内外掀起的技术浪潮或将有望撬动整个 AI 产业链的既有秩序。
(文:APPSO)