自 ChatGPT 亮相起,大模型领域就不断涌现惊艳时刻,整个行业在过去两年处于“百模大战”的阶段,大众围绕 AI 的讨论和尝试也爆发式增长。然而,伴随着大模型的落地和应用,“祛魅”开始成为大模型用户市场的高频词,资本方面也对其渐渐回归理性。
直到去年年末,整个行业的风向变得更加微妙起来了。
知名投资人朱啸虎曾说,“(AI)六小虎最好的结果就是卖给大厂。”近日,零一万物大部分训练和 AI infra 团队会加入与阿里云共同成立的实验室、成为阿里员工一事已初见苗头。另外最近有传闻称,月之暗面在寻求阿里收购。
还有去年 10 月,AI 垂直领域大模型公司波形智能被智能手机厂商 OPPO 收购,包括 CEO、CTO 在内的多位波形智能团队核心成员也已集体入职 OPPO。
不得不说的,像百度、字节、阿里等均在基座模型、云计算与上层应用中有布局的巨头,在大模型浪潮中显然更有优势。尤其是拥有自家流量渠道、云计算资源的大厂,在投放成本及便捷性上都更加“如鱼得水”。
美国的科技巨头同样在对 AI 初创公司“下手”。
去年 8 月初,AI 独角兽公司 Character AI 以 25 亿美元被谷歌收购,两位联合创始人加入谷歌 AI 团队;更早之前,Adept 在去年 6 月宣布与亚马逊达成技术授权协议,其联合创始人及部分团队成员也加入了这家电子商务巨头;去年 5 月,美国大模型创企 Reka AI 被曝可能以 10 亿美元被云数据巨头 Snowflake 收购;去年 3 月,微软向 Inflection AI 支付 6.5 亿美元以获得该公司的非独家技术授权,并挖角其包括联合创始人在内的大多数员工。
到 2024 年初,苹果已收购 33 家 AI 公司;据市场调研机构 Stocklytics 报告,截止 2023 年,谷歌母公司 Alphabet 收购了 21 家,Meta 收购了 18 家,微软收购了 17 家。
背后的原因是,这些 AI 创企的经营似乎并不顺利。除了零一万物在 2025 才刚开年就被传“放弃预训练、资金链紧张、被阿里收购”外,去年 5 月曾有 10 亿美元估值的明星创企 Stability AI,传出资金链断裂、四处“寻钱”的消息。
还有几家大模型创业公司在去年下半年,开始相继进行人员裁撤。智谱 AI 高峰期有 1000 多人,去年一度缩减上百人;MiniMax 的海外拳头产品 Talkie12 月中旬也在美区 App Store 中消失,商业化和部分产品运营团队总计减员约 50 人;月之暗面则因收缩海外业务,减少 10 余人;百川智能主要调整了 C 端产品人员,减员约 20 人。
与此同时,还有一大波 AI 创企黯然“退场”。
上个月,港股上市公司江山控股旗下的 AI 医疗企业鹰眼智慧中医突然停摆,全体员工解聘。去年 2 月,知名 AI 创业公司竹间智能宣布因业务需求减少,给公司带来了严重的现金流压力和挑战,停工停产 6 个月。还有早在 2023 年 5 月,由谷歌前高管创立、曾经被称为谷歌最危险对手的 AI 搜索引擎 Neeva 宣布关闭,并被 Snowflake 收购。
在迅速“收编”大模型创业公司的同时,押注大模型的大厂们还在疯狂收纳核心人才,国内外大厂之间挖人毫不手软,比如谷歌成功挖走了 OpenAI 前开发者关系负责人 Logan Kilpatrick、ChatGPT 核心领导者 John Schulman 加入对手公司 Anthropic。而早先出走大厂创业的人逐渐回流至大厂,如 Character.AI 两位创始人回归谷歌加入 Gemini AI 项目,前零一万物算法副总裁、模型预训练负责人黄文灏加入字节跳动,接着零一万物联合创始人李先刚也被曝出已离职并重返老东家贝壳。
中美 AI 产业结构对比,来源:艾瑞报告
众所周知,所有的大模型公司都要面临三大烧钱问题:训练贵、推理贵、获客贵。此前,月之暗面创始人杨植麟曾被问“如果你今天拿到的钱是最后一笔钱,你会怎么花这笔钱?”时,他很坦诚地回答:“ 我希望这个永远不会发生,因为我们未来还需要很多钱。”
大模型在训练和推理方面消耗巨额资金已经不是稀奇事。根据马斯克的说法,GPT-5 的训练大概需要 3-5 万张 H100,单单芯片成本就超过 7 亿美元,约合 50 亿人民币。而这还仅是训练成本,还未包含人力、数据及基础设施等其它方面的费用。
然而,大模型厂商们花在 C 端营销上的钱更令人咂舌。去年以来,大模型相关的广告大批量出现在公众设施,包括地铁、写字楼和机场的广告牌,甚至是纽约时代广场。据凤凰网科技报道,一位从事地铁广告投放的相关人员表示,智谱在一些地铁进行的广告投放都是百万起步。
除了线下宣传,这些大模型厂商的线上投流也很“疯狂”。有报道称,据业内人士透露,这些大模型厂商已经成了 B 站除拼多多外最大的“金主”群体。根据移动营销平台 AppGrowing 数据,2024 年以来(截止当年的 11 月 15 日),Kimi、豆包、星野等国内十款大模型产品,合计投放超 625 万条广告,投放金额达 15 亿元。不过这些在各个渠道被火热传播的投放金额,曾被多家厂商质疑数据有所夸大。
总而言之,在数量如此庞大的烧钱竞争下,过去一年来在 AI 行业发生的“淘汰”现象也就不难理解了。据钛媒体 AGI 从国家企业信用信息公示系统统计,自 ChatGPT 发布到 2024 年 7 月 29 日(最新)期间,国内新注册成立后现在却处于注销吊销或停业异常状态的人工智能(AI)相关公司数量达 78612 家,接近 8 万家企业已经消失,占同期新注册 87.8 万家企业总量的 8.9%。
“AI 大模型(赛道),将只剩下 10 家企业扮演重要角色。”中国工程院外籍院士张亚勤曾表示。
接下来,大模型赛道的竞赛必将更加残酷。
大模型的竞争除了模型、人才,还有产品,产品是直接对应用户需求的重要中介。当前,各家都发布了自己的主打产品参与市场竞争。
根据第三方 AI 产品榜数据,在 12 月的 AI 应用产品全球总榜中,ChatGPT 的月活量依然断层式遥遥领先,但大多排名前 10 的产品变成了聊天和修图类应用,进榜的两款国内应用产品是豆包和 MiniMax 的 Talkie。同时,豆包也是当月国内应用总榜的 Top 1,有 7100 万的月活跃用户。豆包海外版 Cici 在 12 月的月活也达到 1133 万,位居第 22 位。据 AI 产品榜消息,明年豆包 MAU 目标为 2-3 亿,也就是说要在 25 年底追平 24 年底 ChatGPT 的水平。
在具体应用领域上,根据 12 月 AI 网站全球榜,排名前十的除了聊天机器人外,都是工作提效类的工具,包括 AI 搜索引擎及设计、翻译、写作工具。
来源:AI 产品榜
其中,唯一进榜的国内 AI 产品是纳米 AI 搜索(原 360AI 搜索),月访问量达到 3.59 亿,仅次于 New Bing,而且超过了国外现在最火的 AI+ 搜索产品 Perplexity,是 TOP10 里增速最快的 AI 产品,同时也是 12 月国内网站总榜的 Top 1。“一切皆可生成视频”是纳米 AI 搜索的主打卖点,360 将其定义为多模态内容创作引擎。在国内总榜的前 10 网站产品中,还出现了同样主打 AI 搜索的秘塔 AI,该产品的亮点是:承诺没有广告,目前也没有付费版本,于去年 3 月正式上线,且当月网站访问量超过 700 万次。
由此也可见,面向 C 端的 AI 搜索是一波非常大的机会,其盈利模式成熟,且 AI 搜索的确能给普通用户带来工作及生活上的效率提升。百度创始人、董事长兼 CEO 李彦宏在最近的公开演讲上也表示,搜索是智能体最大的分发入口。
尤为一提的是,在 12 月的榜单里还冲出了一匹“黑马”,即发布了全新系列开源模型 DeepSeek-V3 的 DeepSeek ,凭借其模型对齐海外领军闭源模型的性能效果和低廉的训练成本,DeepSeek 网站 12 月的访问量达到了 1101 万,增速高达 160.63%。
情感陪伴似乎也在逐渐成为 AI 应用的重要机会,Talkie 在去年 12 月凭 2977 万月活用户反超 Character AI,一举成为全球第一大角色扮演 AI 应用。
AI 编程工具亦是一股不可忽视的应用潮流,作为已经相对成熟的应用领域,Bolt AI、Cursor、Tabnine 和 Aider 等工具各具特色,适合不同需求的开发者。其中,被称为“程序员的 Google Docs”的 Cursor 赢得了不少开发者的青睐。
此外,创意类 AI 工具在持续吸引用户。根据 a16z 统计的全球前 50 名生成式 App 榜单上,52% 的公司专注于内容生成或编辑,涉及多种形式,包括图像、视频、音乐、语音等。在 12 家新入榜企业中,有 58% 属于创意工具领域。三家新入榜企业 LooksMax AI 、Umax 和 RIZZ 则属于美学和约会领域。
将大模型能力直接嵌入已有的应用程序上也是一种选择,比如美图秀秀、夸克等都有自研大模型,但其直接将自研的大模型用到了 App 上,通过增加相关服务方式来吸引用户。财报显示,截至 2024 年 6 月 30 日,美图付费订阅用户数超 1081 万,创历史新高。而 PConline 数据显示,夸克 PC 端位居 2024 年国内电脑端 AI 应用下载量第一,成了年轻人首选的 PC 端 AI 产品。
但无论如何,从目前的情况看,市场尚未等来一个大家期待已久的杀手级应用。毕竟,哪怕是 AI 领域的典型代表 ChatGPT 应用端(不含网站),虽有 2 亿的月活跃用户 ChatGPT,相比月活跃用户 13.7 亿的微信、23.7 亿的抖音(含 TikTok)、30.3 亿的 Facebook 这些超级应用来说,也仍有很远的路要走。
那么,在如今这种 AI 产品方向同质化严重且目标用户高度重叠度的情况下,接下来什么样的产品才可能形成长久的用户群体并最终存活下来?
某视觉生成技术专家向我们透露,搜索领域的潜力巨大,甚至逐渐取代了其日常使用百度搜索的习惯;情感陪伴也非常重要的,尤其是在中国面临老龄化和少子化的背景下;AI 编程辅助非常热门,尤其是结合智能体使用时,确实可以帮助程序员和企业提高编程效率。
上述专家的感受,与各家 AI 产品的最新数据排行变化也是相符的。
此外,该专家认为,一款成功的产品能够顺利运行的关键因素很多,首要的可能是第一波用户的口碑,以及当时的产品运营策略。以小米的 Su7 为例,这应该是一个非常成功的运营案例。这款车本身肯定是不错的,但是否真的像宣传的那么好,这可能因人而异。重要的是,它成功地进入了一个正向的闭环并持续运营。
“明年买量和铺量的策略仍然存在。”该专家表示,参考抖音早期的发展情况,地铁、机场,几乎随处可见抖音的广告。豆包也是如此,字节投入了大量的资金进行买量,虽然这只是内部结算的逻辑,但它确实在抖音这个庞大的流量平台上进行了大量的推广。不过,买量策略继续的前提是,产品至少要能够抓住用户的痛点。
2023 年百模大战后,大家清晰地认识到 2024 年会是各家的生死之年,而 AI 厂商们的“厮杀”离不开与资本的博弈。
一个清晰的变化是,投资人已不再毫无顾忌地给厂商投钱。“尽管前景不错,但这项技术还远未达到实用所需水平。过度建造世界上没有用处或尚未准备好的东西,通常会导致糟糕的结果。”一位华尔街分析师的话很具有代表性。
之前的投资人很“FOMO”:阿里全部参股“AI 六小虎”,腾讯投资了其中三家,此前收购光年之外的美团则投资了智谱 AI。目前,智谱 AI、月之暗面、百川智能、阶跃星辰的估值均已跻身 200 亿元估值阵营。
现在的投资人也很“FOMO”:据四木相对论报道,有投资人称“现在除了国资,基本没有什么潜在买家。”有企业希望长期寻找国际化资本的支持,但没有拿到结果。全球在 AI 领域的投融资都变得谨慎。
如今,投资人的重心似乎已基本转移到了大模型的应用上。基座模型领域初步竞争格局已现,当前的大模型应用需要解决具体问题,比如设计、编程、医疗、招聘等更容易让人感到其价值的地方,仅提供聊天能力是不够的。
因此,大模型厂商们一边发展自己的模型能力,一边结合自己的资源和优势寻找落地场景。比如,百川智能的基座模型研发放缓,重心转向了医疗、金融等行业大模型上;面壁智能转向端侧模型,扎进主流消费电子和新兴硬件领域;月之暗面重点推广自己的独立 App;MiniMax 推出的 AI 陪伴应用 Talkie 火爆海外;智谱 AI 的重心仍然在模型研发上,包括多模态模型、智能体平台等;年末黑马 DeekSeek 目前也专注在大模型训练方面上。
互联网大厂们则力求全面发展,同时也都在打磨自家的突出模型或产品,比如阿里的 Qwen 系列模型和快手的视频生成大模型 Kling(可灵)在全球社区中赢得不错评价,而字节的豆包收获了不错的月活用户量。
另外,投资人对 AI 厂商能真正将这项技术转化为盈利业务的能力保持怀疑,而商业化也是今年各家企业绕不过去的话题。
现在,通过 API 按量计费,同时推出订阅制服务几乎是国内外大模型厂商的标配。为抢夺用户,各家纷纷打起了价格战,这让每百万 token 的价格从百元直降至几厘。
为压缩成本,厂商们在技术上采用了多种优化推理方法包括 Prefix caching、PD 分离、Continuous Batching、量化压缩、投机解码等方式优化推理效率,虽然不同企业会有不同的侧重,但思路较为相似。
大模型训练降本的典型是 DeepSeek-V3,其采用 FP8 混合精度训练框架,首次在超大规模模型上验证了 FP8 训练的可行性和效果,在保证模型计算精度的前提下大幅减少了内存使用和计算成本。DeepSeek 实施了数十项优化技术来降低其 DeepSeek-V3 的计算需求,并通过算法、框架和硬件的综合优化,实现计算与通信的高度重叠,此外还对 GPU 集群进行了优化。但是具体实践上,大家还不能清晰地了解细节。还有像极佳科技,透露其在过去一年训练一个视觉大模型的成本,从 500 万美金下降到了 100 万美金以下。
应用实践中,在对模型能力要求不是那么高的场景,企业会选择使用大小模型协同的方式。在性能和成本之间做取舍是不可避免的。小模型成本低但效果会打些折扣,但大小模型混合使用就能得到可接受的性能,同时成本下降比较明显,像 Apple Intelligence 就是采用了大小模型相结合的方式。
值得注意的是,业内整体模型的部署运维的效率并不高,像应用侧企业在前期在要效果和要效率之间,优先选择效果,虽然也未真正找到最佳的大模型应用范式。但在明年,部分企业将开始重点投入到运维效率上。
此外,多模态模型正在成为各家竞争的一个领域。像“Recraft.ai”公司开发的、引起广泛关注的小熊猫“red_panda”表现非常出色。Stability 公司的研究员们离开后成立了黑森林公司并发布了有名的 Flux 模型,在开源和闭源领域中都处于领先水平。另外,快手、字节等公司也在文生图方面加大了投入力度,而像Midjourney 没有像大家想的那样推出视频生成模型,仍然专注于图像领域。
在 Sora 火了后,国内对文生视频的态度最先比较谨慎,对文生视频模型的跟进并没有预期的快速,最大的考量还是投入和收益问题。典型的如百度李彦宏在 10 月底仍然表态不做 Sora,理由是视频生成模型投入周期太长,10 年、20 年都可能拿不到业务收益,“无论多火爆,百度都不去做。”但国内其他厂商已经逐渐跟进,包括快手的可灵、生数科技 Vidu、MiniMax 海螺视频、爱诗科技 PixVerse、字节即梦、阿里通义万相等。但整体上,国内玩家不如国外玩家多。
经过一年的厮杀,有人暗淡了下去、有人还在摸索可行之路。在 2025 年,对于 AI 厂商的考验只多不少。基座模型还要如何“卷”?商业模式怎么搞?落地应用是真需求吗?这些问题留给大家解答的时间不会很多。
与此同时,在竞争如此激烈的情况下,谁家还能保持自己当初“AGI”的梦想呢?
(文:AI前线)