作者|沐风
来源|AI先锋官
DeepSeek对国内AI生态的重塑,正不断深化。
最新的进展是,长期推崇闭源模式的百度在昨天宣布,其搜索和文心智能体平台,将全面接入DeepSeek。
李彦宏曾在2024年世界人工智能大会上明确表示,闭源模型在同等参数规模下能力更强,且能形成可持续的商业模式。
他称开源是“智商税”,认为开发者若依赖开源模型,可能因无法同步基础模型升级,而失去竞争力。
此次百度接入DeepSeek与其此前坚持的闭源立场相互矛盾,被称为“打脸”。
另一方面,在这背后,也仍旧能找到些许逻辑的一致性。
去年7月,李彦宏曾在看衰开源大模型的同时,同时强调称:“没有应用,基础模型一文不值。”
今年的2月11日,李彦宏针对DeepSeek表态称,我在过去几个月中学到的是,开源可以帮助你获得更多关注。
他认为,AI大模型仍然处于渗透的非常早期阶段,不管是开源还是闭源路线,行业共同努力的方向,都是尽力推动应用落地。
而为了应对 deepseek风暴,除了接入, 2月13日,百度宣布,文心一言将于4月1日零时起全面免费,及上线深度搜索功能。
2月14日,百度又宣布,将在未来几个月中陆续推出文心大模型4.5系列,并于6月30日起正式开源。
这系列动作展现出百度应对DeepSeek冲击的”组合拳”,既通过接入保持技术竞争力,又通过免费化和开源策略维持生态存在。
但这也暴露其原有战略的困境,据IDC数据显示,文心智能体平台开发者活跃度已连续三个季度环比下降12%。
日前,微信正灰测接入DeepSeek R1模型的消息刷屏。
相关阅读:被灰度到了微信+DeepSeek 搜索,第一时间上手体验出炉
要知道,自业内开展大模型军备竞赛以来,相较其他大厂,腾讯一直处于“不冷不热”的状态。
腾讯一贯在技术创新上慢半拍,但喜欢在新技术趋势明朗后,利用自己超级应用和巨大流量进行战略布局。
业内观点认为,微信接入 DeepSeek – R1有技术、竞争等多方面的原因,背后也有着生态、市场等多维度的战略构想,此次后发制人之举,带来的叠加效应不可小觑。
此举也被认为,将重塑微信的商业化天花板:B端可通过API向企业输出智能客服、营销文案生成等能力;C端也可推出订阅制AI服务,激活用户付费意愿等。
能被印证的是,自微信接入DeepSeek的消息传出后,腾讯的股价表现强劲。
据报道,腾讯股价今日一度上涨至512港元,并创下了自2021年10月21日以来的最佳表现。截至上午10点左右,腾讯控股涨超7.5%,市值暴增约3200亿港元(约合人民币2981亿元)。
这印证了摩根士丹利分析师的观点:“拥有10亿级日活的超级APP与大模型结合,将释放指数级商业价值。”
同时,腾讯此次的做法也使得科技大厂们,不得不重新审视自身的AI战略。
即便是字节跳动旗下日均调用量突破4万亿次的豆包大模型,在面对DeepSeek-R1的快速崛起和腾讯的接入,也面临着一定压力。
在近期的内部会上,百度智能云事业群总裁沈抖点评称,面对DeepSeek的来势汹汹,首当其冲的AI产品便是字节的豆包,认为豆包的训练成本和投流成本都很高。
对此,火山引擎总裁谭待通过朋友圈回应称,大模型降价是通过技术创新实现的,大家应像 DeepSeek 一样聚焦基本功,少做无端猜测。
谭待表示,豆包1.5Pro模型的预训练成本、推理成本均低于DeepSeek V3,更是远低于国内其他模型,在当前的价格下有非常不错的毛利。
近日,在字节跳动内部举办新一期全员会上,针对AI业务,字节CEO梁汝波也谈到了最近爆火的 DeepSeek。
他表示,DeepSeek R1创新点之一的长链思考模式不是业界首创,去年9月OpenAI发布长链思考模型、成为行业热点后,字节意识到技术重大变化,但跟进速度不够,如果当时及时关注到,有机会更早实现。
一方面,阿里巴巴一直是开源模式的倡导者和践行者,Deepseek 的成功其实是对其的加持。
阿里巴巴集团CEO吴泳铭在2024年世界互联网大会上表示,阿里将坚持向全球开源开放,推动AI能力转化为千行百业的生产力。
目前,阿里巴巴已上架100多个AI开源模型,累计下载量突破4000万,极大降低了工业开发使用AI的门槛。
另一方面,阿里通义千问模型主要阵地还是在To B,且一直坚挺。
日前, 阿里云各平台,包括钉钉等,都接入了Deepseek,这是对其客户服务能力的有效补充。
而且,通义Qwen的技术实力并不比Deepseek差,而是各有千秋。
比如,最近斯坦福大学李飞飞团队联合华盛顿大学研究人员基于阿里云通义千问(Qwen)的一款小型现成AI模型,以不到50美元的云计算费用成功训练出了一个名为s1的推理模型。
关联阅读:“李飞飞团队50美元复刻DeepSeek R1”之辨
不止如此,在国内大模型里,自始没有一个达到DeepSeek这样的全球热度。
作为创业公司,在前年的AI初始时代,他们曾风骚无限,去年则都面临增长危机,但还是被广泛关注和期待。
其中,反差最大的应该是月之暗面,在此之前,他才是国内AI的最优等生。
例如,几乎与DeepSeek同时发布的Kimi全新强化学习模型1.5,虽然是全球继OpenAI之后首个多模态类o1模型,在诸多层面能力接近o1甚至是超越,但也并没有溅起多大水花,同样淹没在了DeepSeek狂热的舆论中。
据报道称,月之暗面内部已将“持续拿到SOTA结果”确定为最重要的工作目标。2025年,月之暗面计划在模型能力方向上加强多模态和长文本推理能力。
DeepSeek的爆火让外界重新审视了月之暗面的技术和用户增长模式,两者在闭源与开源、预训练与蒸馏技术等方面存在差异。
虽然月之暗面尚未明确是否会因DeepSeek而调整工作重心一事,但有业内人士透露可能会将强化学习作为一个工作重点方向。
除了Kimi, DeepSeek“冲击波”下,其他“AI 六小龙”的处境同样,甚至更加尴尬。
比如,智谱宣布和三星在智能体方面展开合作,三星旗下最新的Galaxy S25系列手机可以支持基于AI的实时语音和视频通话,以及实现图片理解和系统功能调用、AI搜索、文案写作等,智谱清言也成了三星手机的预装软件。
零一万物宣布与苏州高新区联合成立“产业大模型基地”,零一万物CEO、创新工场董事长李开复强调“在人工智能技术重构产业的关键节点,大模型绝非‘空中楼阁’,而是驱动实体经济的核心引擎。”
百川智能则集中到了医疗行业,推出了AI健康顾问、智能诊断助手等产品,百川通过与多家医疗机构合作,积累了丰富的医疗数据资源,同时构建了超过千亿Token的医疗数据集,包括医学研究文献、电子病历资料等。
当DeepSeek创始人刘庆峰在内部信中写下”这不是终点,只是新起点”时,整个行业都意识到,这场重塑不仅关乎技术路线,更是整个产业价值链条的重构。
(文:AI先锋官)