跳至内容
(图片来源:钛媒体AGI编辑林志佳拍摄)
DeepSeek“现象级”的崛起,冲击了全球资本市场,并引发市场对美国技术主导地位的质疑。
钛媒体AGI 1月27日消息,DeepSeek(深度求索)应用登顶美区苹果App Store应用商店免费榜,力压ChatGPT、谷歌Gemini、微软Copilot等美国生成式 AI 产品。同时,DeepSeek在国内App Store免费榜同样位居第一,超越豆包、小红书等。
27日美股盘前,AI芯片龙头英伟达(NASDAQ:NVDA)股价大跌超过12%,市值蒸发超4000亿美元(2.94万亿人民币),这比AMD和英特尔的市值总和还要高。目前AMD市值约为2000亿美元,英特尔市值不到900亿美元。
同时,博通(NASDAQ:AVGO)跌13%、台积电(NASDAQ:TSM)跌10.1%、阿斯麦(NASDAQ:ASML)跌8%、美光(NASDAQ:MU)跌6.48%;谷歌母公司Alphabet (NASDAQ:GOOG)跌4.09%、Meta (NASDAQ:META)跌5.79%、亚马逊(NASDAQ:AMZN)跌6.33%;而A股AI算力指数今日跌3.94%,寒武纪一度跌10%,中际旭创跌超10%,工业富联跌超8%。
据彭博统计,27日盘前,纳斯达克100期货暴跌1100点。如果开盘后美股跌幅持续,受DeepSeek消息影响,纳斯达克100和欧洲斯托克600科技分指数的市值就将共同蒸发约1万亿美元。
分析师Holger Zschaepitz表示:“中国的DeepSeek可能代表了对美国股市最大的威胁,因为该公司似乎以极低的价格建立了一个突破性的 AI 模型,而无需依赖最先进的芯片,这引发了对数百亿美元资本支出是否有用的质疑,这些资金正被投入到这个行业中。”
对于DeepSeek热潮,零一万物CEO李开复最新评价称,DeepSeek的成功,让“中国AI有望击败美国”这一观点得到验证。
中欧国际工商学院决策科学与管理信息系统教授谭寅亮对钛媒体AGI表示,对于DeepSeek这样的产品来说,其成功更多依赖于高效的算力调度和模型优化能力,而非单纯堆积硬件资源。因此,出口管制等外部限制可能影响行业发展速度,但并不一定会阻碍本土大模型的长期竞争力和全球化扩张。
事实上,由于用户源源不断地涌入DeepSeek,继昨天和今天上午出现局部服务波动导致数分钟的短暂系统崩溃后,截至发稿前,DeepSeek又火到“宕机”,据官方早前回应称,可能与服务维护、请求限制等因素有关。
DeepSeek走红后美国科技股暴跌,
美国人到底在担心什么?
DeepSeek,不同于国内众多依赖互联网巨头背景的AI公司,它由国内领先的量化私募机构——幻方量化所运营。
2024年5月,公司发布了DeepSeek-V2,凭借其创新的模型架构和极高的性价比迅速走红。该模型的推理成本降低至每百万Tokens仅1元,仅为开源大模型Llama3 70B的1/7、GPT-4 Turbo的1/70,引发了包括字节、阿里、百度等企业在内的模型降价风潮。
DeepSeek在海外真正“出圈”还是近一月以来的一系列产品发布。
2024年12月,新一代千亿参数规模的基座模型DeepSeek-V3首个版本上线并同步开源;仅一个月后,DeepSeek又开源了R1推理模型,今年1月24日,DeepSeek-R1在Chatbot Arena综合榜单上位列第三,与OpenAI的顶尖推理模型o1并列。
据DeepSeek介绍,R1的预训练费用只有557.6万美元,在2048块英伟达H800 GPU(针对中国市场的低配版GPU)集群上运行55天完成,仅是OpenAI GPT-4o模型训练成本的不到十分之一。
中国工程院院士、清华大学计算机系教授郑纬民认为,DeepSeek自研的MLA架构和DeepSeek MoE架构,为其自身的模型训练成本下降,起到了关键作用。MLA主要通过改造注意力算子压缩了KV Cache大小,实现了在同样容量下可以存储更多的KV Cache,该架构和DeepSeek-V3模型中FFN 层的改造相配合,实现了一个非常大的稀疏MoE 层,而这也成了“DeepSeek训练成本低最关键的原因”。
在算力、资金、芯片限制等外部挑战之下,包括DeepSeek在内的中国大模型厂商均着力于软件、算法等优化,利用 AI Infra等手段,最大化“压榨”算力实现了训练和推理成本降低、模型性能提升的效果,相对于OpenAI、Meta堆砌资源方案有所区别。
一个对比是,DeepSeek R1模型每百万token的查询成本仅为0.14美元,而OpenAI的成本为7.50美元,便宜了98%,而且允许开源。
据公开信息,OpenAI每年在模型训练投入高达50亿美元以上,谷歌2024年资本支出超过500亿美金;Meta CEO扎克伯格最近表示,该公司2025年向 AI 基础设施等方面计划资本投入600亿-650亿美元,比2024年的380亿-400亿美元增长62%,并到年底将拥有超过130万个GPU计算卡。然而,OpenAI等企业在 AI 层面至今仍未获得收入。
因此,华尔街担忧DeepSeek这种高性价比模式会让GPU销量放缓,不应该再大量投入资本到算力层面当中。
彭博社分析称,DeepSeek在次先进的AI芯片上以更低成本的方式训练出有效的模型,这令市场对英伟达一飞冲天的3万亿美金市值产生疑虑,这也让中国AI发展落后于美国数年的认知受到冲击。
《纽约时报》 也发文指出,DeepSeek以不到600万美元的纯算力成本训练大模型,这一成本仅为Meta训练大模型纯算力成本的十分之一,挑战了“唯有美国科技巨头才能研发尖端AI”的普遍认知。
不同于中国公司“榨干每一张卡的性能”,硅谷的叙事更多是“先基建、再研发”。过去两年多,美国云厂商不惜投资数千亿美元买卡建设大规模算力中心给生成式 AI 模型进行训练和推理,英伟达数据中心业务收入从2023财年第三季度(截至2022年10月底)的36.16亿美元,攀升至2025年第三财季的307.71亿美元,增长超过9倍。
OpenAI、xAI、Anthropic三家大模型公司甚至在筹建单集群百万先进GPU的算力基础设施。就在本周,OpenAI、软银集团和甲骨文公司宣布成立一家名为Stargate(星际之门)的1000亿美元合资企业,英伟达将提供大量H100 GPU产品,预计会拥有大量AI算力进行训练模型。
但是,DeepSeek的走红,“戳破”了美国算力股的泡沫,势必让硅谷公司意识到一味扩大规模并不是必须。
谭寅亮曾在斯坦福大学人工智能研究院和数字经济实验室担任访问学者,他对钛媒体AGI表示,DeepSeek展示了“小而精”模式的潜力,尤其是在资源相对有限的情况下,通过高效的技术路径和精准的市场定位,可以取得快速突破。但从长期来看,美国企业在“堆砌资源”方面的优势依然难以忽视。大规模资金投入可以推动更大的模型规模、更强的算力支持以及更广泛的数据覆盖,这种技术和资源上的积累效应难以在短期内被完全替代。然而,DeepSeek也提醒业界,不同技术路线和市场策略的多样化竞争可能削弱“堆砌资源”模式的垄断性效应,推动创新更广泛地普及和落地。
中国 AI 加速追赶,
DeepSeek冲破算力限制
中国从2022年ChatGPT发布之时的落后,到如今国内 AI 大模型产品与OpenAI旗舰产品处于“比肩”程度。
前谷歌CEO埃里克·施密特(Eric Schmidt)曾表示,中国 AI 发展落后于美国,但之后他改口称,尽管人们之前认为美国在 AI 竞赛中领先中国几年,但中国在过去六个月里“以惊人的方式”赶上了美国,有些产品甚至超越了美国 AI 公司。
谭寅亮指出,“DeepSeek的成功表明,中国企业在AI应用层面和用户体验上具有强大的创新能力,尤其是在产品快速迭代和市场化方面更具优势。这为中国在全球AI竞争中提供了重要的信心,特别是在C端市场表现上,中国团队对用户需求的深刻理解起到了关键作用。但从技术底层来看,美国在基座模型和前沿研究上的持续领先仍是重要支撑,整体竞争格局依然呈现‘底层技术美国强、应用场景中国快’的局面。DeepSeek的崛起进一步推动了这种竞争的动态化发展。”
在谭寅亮看来,中国AI大模型发展的主要制约因素包括以下几点:
“1)算力:虽然国内的算力基础设施建设近年来取得了显著进步,但相比美国顶尖科技企业掌控的超级计算集群仍存在差距;
2)算法创新:在底层算法和理论研究上,与顶尖学术机构和企业的协作尚需进一步加强;
3)出口管制:美国对高端芯片和关键技术的出口限制的确构成短期瓶颈,但也在加速中国本土芯片产业的崛起。对于DeepSeek这样的产品来说,其成功更多依赖于高效的算力调度和模型优化能力,而非单纯堆积硬件资源。未来,算力瓶颈可能会迫使类似DeepSeek的企业在模型压缩和推理效率上持续创新,同时推动基础设施的区域化替代。
因此,出口管制等外部限制可能影响行业发展速度,但并不一定会阻碍本土大模型的长期竞争力和全球化扩张。”
而应对来势汹汹的DeepSeek,OpenAI CEO奥尔特曼(Sam Altman)发文预告ChatGPT免费套餐将可用o3-mini;Meta被曝紧急成立4个作战小分队,层层拆解DeepSeek模型的技术秘诀。OpenAI等其他顶级AI公司的研究人员也一直在仔细研究DeepSeek模型如何做到更便宜高效。
Union Bancaire Privee 董事总经理Vey-Sern Ling表示:“DeepSeek 表明,开发成本更低的强大 AI 模型是可能的。这可能会破坏整个 AI 供应链的投资案例,而该供应链是由少数超大规模企业的高额支出推动的。”
李开复早前表示,目前一个推理模型的训练纯算力成本仅为300万美元左右。他表示,“美国在研究和创新方面很出色,尤其是突破性进展,但中国在工程方面更胜一筹。在当今时代,当你拥有有限的计算能力和资金时,你会学会如何非常高效地构建事物。”
很显然,在当前新的中美 AI 热潮下,DeepSeek一定程度下克服了算力限制瓶颈,让中国在与 AI 领导地位中得到回报。长期来看,中国和美国的 AI 技术竞争仍将持续。
(文:钛媒体AGI)