全球用户更爱用哪个AI模型?OpenAI和谷歌领跑,Anthropic下滑,多个国产模型表现突出

文丨丁灵波
人工智能市场格局正以前所未有的速度演变,各家模型的PK你追我赶
最新研究发现,类似聊天机器人竞技场(Chatbot Arena)这类排行榜的一些系统性问题会导致不公平的竞争环境和排位成绩,例如Meta旗下Llama 4模型从基准高分到实测翻车就是一个典型。
原因之一是,未公开的私下测试做法使少数几个头部模型供应商受益;此外,专有封闭模型被采样的频率更高,并且与开放权重模型和开源模型相比,从竞技场中移除的模型更少,这两种情况都导致了巨大的数据访问不对称;与此同时,一时领先的模型也可能因厂商的强大升级或意外颠覆者的出现而迅速改变。
为了在基准之外增加一个市场观察维度,今天,有 “美国版知乎”之称、全球知名问答平台Quora打造的聊天机器人Poe团队抛出一份最新市场分析报告,其数据来自Poe的订阅用户,涵盖对集成的100多个AI模型的使用情况分析,为了解行业基准之外的实际用户偏好提供了新视角。
分析显示,2025年1月至5月期间,所有主要AI应用类别的市场份额均发生了显著变化。
Anthropic、DeepSeek势能衰减
2025年1月至5月期间,Poe用户在几个关键应用方向使用频次大大扩展:推理、图像、视频和音频,推理模型持续增长,图像和视频生成变得越来越具有市场竞争力,以及AI音频多样化应用正在崛起。

前沿实验室对更智能的通用模型开发加速,OpenAI的GPT-4.1系列和谷歌的Gemini 2.5 Pro在现实世界编程任务中提供了优异的表现,在发布后几周内,用户份额迅速增加至~10%和~5%。

Anthropic的Claude系列(例如Claude 3.5 Sonnet和Claude 3.7 Sonnet)在同一时期内见证了~10%的绝对份额下降。Claude最近还正在遭遇越来越多的开发者批评,对其模型速率限制变更、付费服务不佳表示不满。

DeepSeek模型的竞争势能已经回落,因其他价格合理、上下文更长的推理模型相继发布,DeepSeek R1的份额从2月中旬的高峰7%下降至4月底的3%。

单个提供商的旗舰模型也在吞噬其前身模型。例如Poe订阅者迅速接受了Claude-3.7-Sonnet,而上一代Claude-3.5-Sonnet尽管仍在大语言模型中保留了约12%的使用率,不过正在快速衰减。

自2025年初以来,前沿实验室一直在快速迭代其推理模型的产品,这导致花费更多时间和算力但能更精确和可靠地解决复杂任务的模型数量激增,在报告期内,用户对模型推理功能的使用从~2%增加到~10%。

上图是推理模型在文本子类别中的使用份额,Poe订阅者中对Gemini 2.5 Pro的使用增长最为迅速,该模型在发布6周内获得了~30%的推理使用份额。

OpenAI在2024年末发布推理模型o1-preview后,一直以无与伦比的速度发布更强大且价格波动合理的推理模型,在2025年前四个月内推出了o1-pro, o3-mini, o3-mini-high, o3和o4-mini,在OpenAI的推理模型中,订阅者更爱迅速采用最新的模型(例如o3-mini→o4-mini, o1→o3)。

尽管xAI的Grok 3在2025年2月公开发布时于基准排行中名列前茅,但在所有推理模型使用中占比不足1%。

混合推理模型的市场应用可能仍处于早期阶段,例如Gemini 2.5 Flash PreviewQwen 3等,它们在文本子类别中的共同使用仍然很小,不到2%,尤其是在开源社区和开发者圈颇具影响力的阿里通义千问模型Qwen3,占比仅有0.7%。
出乎意料,快手Kling成为香饽饽
AI图像、视频生成在质量和符合性提高的情况下,在用户端变得越来越高频使用。

OpenAI的GPT图像生成4月末在API中推出,并在仅两周内迅速达到了17%的图像生成使用率,呈现出类似于DeepSeek的“现象级”传播情况。

谷歌的Imagen 3家族在2025年前几个月使用率增长稳定,从~10%增加到~30%份额,使其与类别领导者黑森林实验室的FLUX系列图像生成模型相平行,后者在4月最后一周的整体占有率约为35%。

图像生成模型的FLUX家族在Poe的整体图像生成份额中保持了其总数量份额优势,但在报告期内已经大幅下降,从~45%跌到了~35%。

值得一提的是,在视频生成领域,中国快手实验室发布的Kling家族视频生成模型迅速获得了约~30%的使用份额,特别是Kling-2.0-Master,在2025年4月末发布的三周内,占到Poe平台全部视频生成的21%。

谷歌的Veo 2在2月发布后的几个月内保持约20%的强劲使用份额,AI视频生成先行者Runway在报告期间,其视频生成的使用份额下降了约40%,降至20%左右。

Kling的快速市场渗透速度凸显了新兴人工智能领域的竞争格局变化之快,随着新晋选手的快速迭代和改进,老牌企业可能无法保持市场先发优势。

在音频生成(特别是文本转语音,或“TTS”)中, ElevenLabs似乎被用户十分偏爱且使用黏性高,在报告期内满足了约80%的所有订阅者的TTS请求。

在这个领域还有Cartesia、 Unreal Speech、 PlayAI和Orpheus等新兴竞争对手,纷纷提供独特的声音选项、声色效果和不同的性价比结构等争夺用户。

大模型PK难言稳操胜券

在当今市场激烈竞逐中,很少有单个模型能长期占据领先地位。

Poe的AI生态系统负责人Nick Huber表示:“作为100多个AI模型的通用门户,Poe对整个生态系统的使用趋势有着独特见解。目前最令人惊讶的是业内模型创新迭代的速度,2025年1至5月的发布数量是2024年同期的3倍,且竞争格局日益多样化。”

报告中指出的一个重要趋势是特定推理模型的快速增长,自2025年初以来,这类模型在Poe上使用占比例已从约2%扩大10%,行业分析师认为,这种向专业推理能力的转变标志着人工智能市场日趋成熟,原始文本生成正在商品化,迫使供应商通过可以获得溢价的更高价值能力来实现差异化。

在视觉AI图像领域,图像质量、对提示的遵循度和渲染速度的快速提升,使这一类别成为竞争最激烈的AI战场之一。

视频生成仍然是面向消费者的AI应用中计算密集度最高的存在,即使是短视频,模型也需要强大的处理能力才能渲染制作完成。这使得视频生成应用比文本和图像生成更加有限,但预计在2025年下半年,成本的快速下降和质量、生成效率提升将推动视频生成应用广泛普及。

AI大模型朝着多模态、多媒体方向的竞争也越来越激烈,这意味着长期以来作为AI开发焦点的文本生成可能会让位于更加平衡的生态系统,在这个生态系统中,文本、图像、视频和音频生成将发挥交叉融合反应。

常规企业目前想跟上人工智能领域的发展速度颇具挑战,企业面临纠结的选择:是选择特定平台深耕实现标准化,还是保持宽泛的灵活性和多样性。
Huber认为,随着AI模型迭代速度还在不断加快,如果你是一家致力于大规模应用AI技术的企业,提前对强大且不依赖于特定供应商的解决方案进行投资可能至关重要,因为本月采购的最佳模型下个月可能会成为市场中的失败者。

(文:头部科技)

发表评论

×

下载每时AI手机APP

 

和大家一起交流AI最新资讯!

立即前往