2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?

近期,推特博主「karminski-牙医」发布了一篇关于 2025 年上半年大模型 API 市场数据分析帖子,基于 OpenRouter 数据,「karminski-牙医」分析了上半年大模型的总 Token 使用量排名及趋势、不同大模型的市场份额占比、细分领域模型的应用偏好、以及 API 接口使用趋势,得出了一些非常有趣的观察结论。以下为具体分析内容。

来源:https://x.com/karminski3/status/1942612077241311386


超 9000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

邀请从业者、开发人员和创业者,飞书扫码加群: 
进群后,你有机会得到:
  • 最新、最值得关注的 AI 新品资讯; 

  • 不定期赠送热门新品的邀请码、会员码;

  • 最精准的AI产品曝光渠道



01 

一季度 AI 总 Token 使用量增长近 4 倍,

存在活跃长尾需求

首先,我们来看看最热门模型的趋势。最新数据显示,Gemini-2.0-Flash 排在首位,其次是 Claude-Sonnet-4,然后是 Gemini-2.5-Flash-Preview-0520。

排在第 4 位和第 5 位的分别为 DeepSeek V3 0324 的免费版和付费版,如果将两者的使用量加在一起,DeepSeek-V3 的使用量可能达到第二名的水平。

此外,我们还可以从趋势图中得出一些独特的观察结论:

  • 2025 年第一季度,AI 出现绝对的爆发式增长,2025年第一季度 OpenRouter 的总 Token 使用量相较于上一季度增长四倍,之后稳定在每周 2T Token 的水平。此后没有再显著增长的情况。

  • 其他模型的用量在第一季度爆发后,稳定在了 600-700B Token 的使用量。这个情况在一定程度上反映了市场需求的多样性,庞大的长尾量证明了模型市场的活跃度,以及存在细分需求。

  • DeepSeek-V3 自发布以来,一直稳定在 Top 10 中,用户留存率极高。

  • Gemini-2.0-Flash 因为其低定价(输出每百万 Token 0.4 美元)、大容量和速度快等特点,保持了非常稳定的使用量,一直排在模型用量的前三位。

  • Gemini-2.5-Flash 势头强劲,考虑到它很可能在价格下降后取代 Gemini-2.0-Flash,谷歌的模型策略定位非常好。

  • Gemini-2.5-Pro 取代了之前的实验版本,但使用量没有显著增长。

  • Claude-3.5-Sonnet 在今年 3 月底完成了其历史使命,而 Claude-3.7-Sonnet 也正接近其生命周期的尾声。

  • Claude-Sonnet-4 现在已经接替了之前 Claude 系列模型的市场位置,但其使用量保持稳定,没有持续显著增长。

  • OpenAI 的模型无法保证每周使用量能有一款稳定保持在 Top 10。

  • GPT-4o-mini 的使用量波动很大,尤其是在 5 月份表现突出,可能源自于 OpenAI 市场营销的结果。


02 

谷歌 Gemini 系列稳居市场份额第一,

OpenAI 波动明显

市场份额方面,谷歌以 43.1%的份额稳居第一,DeepSeek 和 Anthropic 分别以 19.6%和 18.4%的份额占比位列第二和第三。

从市场份额数据中,我们发现:

  • 谷歌目前正在强势挤压属于 Anthropic 的市场份额。

  • DeepSeek 自 DeepSeek-V3 发布以来,一直保持着一定的市场份额,并且在持续扩大。

  • OpenAI 的份额波动尤其剧烈,尽管排名第四,但和前一名 Anthropic 差距显著。

  • Llama 的份额持续萎缩,已缩减至其峰值的约五分之一。

  • 其他模型的总份额占比不超过 10%。

  • 专注于微调模型的组织 Gryphe 已经在排名上消失了 ,Gryphe 基于 llama2 模型微调的 MythoMax13B 模型曾一度在 AI 角色扮演场景中特别受欢迎。


03 

四家巨头分占不同细分领域

在细分领域模型的用量数据方面,我们发现:

  • 在编程领域,Claude-Sonnet-4 是绝对的领先者,占据 44.5%的份额,其次是 Gemini-2.5-Pro。

  • 在文本翻译领域,Gemini-2.0-Flash 占据绝对优势,主要是源于其用量大、价格实惠且速度快。此外,还有一个令人惊讶的发现是,排名中除了第二名占据 20%份额的模型外,前几名中有七款都是谷歌的模型。推测部分翻译软件可能已经默认集成谷歌模型。

  • 在角色扮演领域,市场呈现高度碎片化的现状,小众模型合计占据 26.6%的份额。其次是 DeepSeek 凭借高幻觉倾向,在角色扮演领域领先。第三名则是价格实惠、用量大的 Gemini-2.0-Flash。

  • 在营销领域,GPT-4o 是无可争议的绝对领先者,拥有 32.5%的份额,这可能反映了 OpenAI 在非编程专业领域的训练相当有效,用户确实很喜欢 GPT-4o 的输出。

编程领域的模型调用量

翻译领域的模型调用量

角色扮演领域的模型调用量

市场营销领域的模型调用量


04 

API 接口使用趋势:

代码编写工具占据主流

最后,来看看大家在 OpenRouter 上主要使用哪些接口(界面):

  • 排在前两名的是 Cline 和 RooCode,两者都主要用于编写代码。

  • 第三名是 liteLLM,这是一个用于构建各种应用程序的路由库。

  • 第四名 KiloCode,同样是用于编写代码。

  • 第五名是 SillyTavern,这是一个类似于 Ollama 的本地大型语言模型(LLM)接口,可以通过它连接并与大模型进行交互。


05 

总体观察

基于以上数据观察,我们得出了几点结论:

  • 目前,谷歌几乎占据了大模型 API 市场近一半的份额,其解决方案模型覆盖多个领域,甚至包括价格实惠、价值高的 Gemini-2.0-Flash(比 DeepSeek 更便宜)。

  • Anthropic 则专注于编程领域,其 Claude-3.5、Claude-3.7 和 Claude-4 模型实现了新旧版本之间的平稳过渡。

  • OpenAI 在大模型 API 市场的表现并不强势,可能由于多种限制因素,比如最新版的模型需要在其官网申请 AccessKey,或者定价问题等。

  • DeepSeek 模型拥有强大的用户粘性。令人惊讶的是,DeepSeek-V3 在市场中最受欢迎而不是 DeepSeek-R1,可能是由于 DeepSeek-R1 可能需要过长的处理时间,首个有效 Token 输出过慢,导致用户量不如 V3。

  • Meta 的 Llama 系列模型已经日渐式微。

  • Mistral AI 的模型出人意料地占据了大约 3%的市场份额,就我个人接触到 Mistral AI 用户的范围相对有限,主要是一些喜欢微调开源模型的欧洲用户。

  • X-AI 的 Grok 系列模型虽然取得了一些进展,但市场定位不明确。如果 X-AI 的目标是成为 SOTA 模型,那他们还有很长的路要走。

  • 通义千问(Qwen)系列模型占据了 1.6%的市场份额,需要继续努力。




(文:Founder Park)

发表评论