DeepSeek 永远改变了全球科技竞争的轨迹。在中国,创始人梁文峰已成为当地的冠军。对于一个海外学历——尤其是美国学历——仍被视为比国内学历更受推崇的国家,学生和家长们惊讶地发现,他的人工智能初创公司的研究团队都是在国内受教育的。
中国在追求技术方面比以往任何时候都更加自信。DeepSeek 的成功削弱了在中美科技战争中形成的障碍。
这家总部位于杭州的公司的决定发布一个低成本、开源的 AI 模型,并详细披露其训练方法,这意味着从圣保罗的研究人员到斯德哥尔摩的初创公司,再到内罗毕的医生,所有人都可以以极低的成本甚至免费访问最先进的 AI。
在中国初创企业领域,正在发生连锁反应。新的人工智能应用正在被创造。竞争将变得更加激烈。早期风险投资的风险偏好正在增加。DeepSeek 决定追求开源人工智能模型,这一决定令人鼓舞,并对其他公司施加了压力,促使他们也采取同样的做法。第一个做出反应的是阿里巴巴的通义千问团队,他们在中国新年到来前夕发布了 Qwen2.5 的开源版本。
这是一个显著的变化。在美国初创公司 OpenAI 于 2022 年底发布其生成性 AI 模型 ChatGPT 后,全球数字经济正逐渐被少数科技巨头控制。这些参与者追求规模而非效率——构建越来越大的模型,这些模型需要惊人的计算、能源和资本,同时将其训练方法视为商业机密。
集中化、封闭的模型创造了一个危险的反馈循环。它们积累的数据越多,变得越强大,进一步边缘化任何在其门外的人。对于消费者来说,这意味着高额费用、放弃数据,以及在没有实质性参与的情况下观看人工智能的未来展开。
DeepSeek 的推理 R1 模型的潜力在于其适应性。由于是开源的,它可以根据当地需求进行定制。它通过一种称为稀疏神经网络训练的方法避免了冗余计算,这意味着它的效率将计算和能源需求降低了几个数量级。
这意味着先进的人工智能可以惠及大众,而不仅仅是少数人。它证明了这项技术是一种商品。数十亿美元不必浪费在封闭模型的科技巨头之间的竞争上。人工智能的价值不应在于专有模型,而在于我们所有人能够用它做什么。
作为投资者,我担心 DeepSeek 的突出地位可能会导致美国选择更严厉的制裁。在中国,像 Nvidia 的强大 H100 这样的 GPU 的出口限制阻碍了初创企业的增长。由于合规风险的担忧,来自外国投资者的资金有限。但真正的危险在于限制全球教育和研究合作的机会,这扼杀了维持进步所需的全球知识流动。人才可以绕过芯片短缺,但设立学习障碍则有可能导致长期停滞。
然而,即使是更多的美国限制、阴谋论和针对 DeepSeek 的抹黑活动也无法改变这样一个事实:这家中国初创公司将人工智能带到了人类手中。
本文翻译自:https://www.ft.com/content/3549cc33-e04d-41da-8c58-525d5bb2ba4c
编译:ChatGPT
(文:Z Potentials)