
2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?
近期,推特博主「karminski-牙医」发布了一篇关于 2025 年上半年大模型 API 市场数据分析帖子,基于 OpenRouter 数据,「karminski-牙医」分析了上半年大模型的总 Token 使用量排名及趋势、不同大模型的市场份额占比、细分领域模型的应用偏好、以及 API 接口使用趋势,得出了一些非常有趣的观察结论。以下为具体分析内容。
来源:https://x.com/karminski3/status/1942612077241311386
超 9000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。

-
最新、最值得关注的 AI 新品资讯;
-
不定期赠送热门新品的邀请码、会员码;
-
最精准的AI产品曝光渠道
01
一季度 AI 总 Token 使用量增长近 4 倍,
存在活跃长尾需求
首先,我们来看看最热门模型的趋势。最新数据显示,Gemini-2.0-Flash 排在首位,其次是 Claude-Sonnet-4,然后是 Gemini-2.5-Flash-Preview-0520。
排在第 4 位和第 5 位的分别为 DeepSeek V3 0324 的免费版和付费版,如果将两者的使用量加在一起,DeepSeek-V3 的使用量可能达到第二名的水平。

此外,我们还可以从趋势图中得出一些独特的观察结论:
-
2025 年第一季度,AI 出现绝对的爆发式增长,2025年第一季度 OpenRouter 的总 Token 使用量相较于上一季度增长四倍,之后稳定在每周 2T Token 的水平。此后没有再显著增长的情况。
-
其他模型的用量在第一季度爆发后,稳定在了 600-700B Token 的使用量。这个情况在一定程度上反映了市场需求的多样性,庞大的长尾量证明了模型市场的活跃度,以及存在细分需求。
-
DeepSeek-V3 自发布以来,一直稳定在 Top 10 中,用户留存率极高。
-
Gemini-2.0-Flash 因为其低定价(输出每百万 Token 0.4 美元)、大容量和速度快等特点,保持了非常稳定的使用量,一直排在模型用量的前三位。
-
Gemini-2.5-Flash 势头强劲,考虑到它很可能在价格下降后取代 Gemini-2.0-Flash,谷歌的模型策略定位非常好。
-
Gemini-2.5-Pro 取代了之前的实验版本,但使用量没有显著增长。
-
Claude-3.5-Sonnet 在今年 3 月底完成了其历史使命,而 Claude-3.7-Sonnet 也正接近其生命周期的尾声。
-
Claude-Sonnet-4 现在已经接替了之前 Claude 系列模型的市场位置,但其使用量保持稳定,没有持续显著增长。
-
OpenAI 的模型无法保证每周使用量能有一款稳定保持在 Top 10。
-
GPT-4o-mini 的使用量波动很大,尤其是在 5 月份表现突出,可能源自于 OpenAI 市场营销的结果。
02
谷歌 Gemini 系列稳居市场份额第一,
OpenAI 波动明显
市场份额方面,谷歌以 43.1%的份额稳居第一,DeepSeek 和 Anthropic 分别以 19.6%和 18.4%的份额占比位列第二和第三。
从市场份额数据中,我们发现:
-
谷歌目前正在强势挤压属于 Anthropic 的市场份额。
-
DeepSeek 自 DeepSeek-V3 发布以来,一直保持着一定的市场份额,并且在持续扩大。
-
OpenAI 的份额波动尤其剧烈,尽管排名第四,但和前一名 Anthropic 差距显著。
-
Llama 的份额持续萎缩,已缩减至其峰值的约五分之一。
-
其他模型的总份额占比不超过 10%。
-
专注于微调模型的组织 Gryphe 已经在排名上消失了 ,Gryphe 基于 llama2 模型微调的 MythoMax13B 模型曾一度在 AI 角色扮演场景中特别受欢迎。

03
四家巨头分占不同细分领域
在细分领域模型的用量数据方面,我们发现:
-
在编程领域,Claude-Sonnet-4 是绝对的领先者,占据 44.5%的份额,其次是 Gemini-2.5-Pro。
-
在文本翻译领域,Gemini-2.0-Flash 占据绝对优势,主要是源于其用量大、价格实惠且速度快。此外,还有一个令人惊讶的发现是,排名中除了第二名占据 20%份额的模型外,前几名中有七款都是谷歌的模型。推测部分翻译软件可能已经默认集成谷歌模型。
-
在角色扮演领域,市场呈现高度碎片化的现状,小众模型合计占据 26.6%的份额。其次是 DeepSeek 凭借高幻觉倾向,在角色扮演领域领先。第三名则是价格实惠、用量大的 Gemini-2.0-Flash。
-
在营销领域,GPT-4o 是无可争议的绝对领先者,拥有 32.5%的份额,这可能反映了 OpenAI 在非编程专业领域的训练相当有效,用户确实很喜欢 GPT-4o 的输出。

编程领域的模型调用量

翻译领域的模型调用量

角色扮演领域的模型调用量

市场营销领域的模型调用量
04
API 接口使用趋势:
代码编写工具占据主流
最后,来看看大家在 OpenRouter 上主要使用哪些接口(界面):
-
排在前两名的是 Cline 和 RooCode,两者都主要用于编写代码。
-
第三名是 liteLLM,这是一个用于构建各种应用程序的路由库。
-
第四名 KiloCode,同样是用于编写代码。
-
第五名是 SillyTavern,这是一个类似于 Ollama 的本地大型语言模型(LLM)接口,可以通过它连接并与大模型进行交互。

05
总体观察
基于以上数据观察,我们得出了几点结论:
-
目前,谷歌几乎占据了大模型 API 市场近一半的份额,其解决方案模型覆盖多个领域,甚至包括价格实惠、价值高的 Gemini-2.0-Flash(比 DeepSeek 更便宜)。
-
Anthropic 则专注于编程领域,其 Claude-3.5、Claude-3.7 和 Claude-4 模型实现了新旧版本之间的平稳过渡。
-
OpenAI 在大模型 API 市场的表现并不强势,可能由于多种限制因素,比如最新版的模型需要在其官网申请 AccessKey,或者定价问题等。
-
DeepSeek 模型拥有强大的用户粘性。令人惊讶的是,DeepSeek-V3 在市场中最受欢迎而不是 DeepSeek-R1,可能是由于 DeepSeek-R1 可能需要过长的处理时间,首个有效 Token 输出过慢,导致用户量不如 V3。
-
Meta 的 Llama 系列模型已经日渐式微。
-
Mistral AI 的模型出人意料地占据了大约 3%的市场份额,就我个人接触到 Mistral AI 用户的范围相对有限,主要是一些喜欢微调开源模型的欧洲用户。
-
X-AI 的 Grok 系列模型虽然取得了一些进展,但市场定位不明确。如果 X-AI 的目标是成为 SOTA 模型,那他们还有很长的路要走。
-
通义千问(Qwen)系列模型占据了 1.6%的市场份额,需要继续努力。

(文:Founder Park)