2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

10945点击 2025-07-09 15:30

2025 年已经过半，文本生成大模型是否已经进入下半场了？ OpenAI 完全不重视 API 市场？ Grok3 根本没人用？「大模型战」未来的走向如何？

近期，推特博主「karminski-牙医」发布了一篇关于 2025 年上半年大模型 API 市场数据分析帖子，基于 OpenRouter 数据，「karminski-牙医」分析了上半年大模型的总 Token 使用量排名及趋势、不同大模型的市场份额占比、细分领域模型的应用偏好、以及 API 接口使用趋势，得出了一些非常有趣的观察结论。以下为具体分析内容。

来源：https://x.com/karminski3/status/1942612077241311386

一季度 AI 总 Token 使用量增长近 4 倍，

存在活跃长尾需求

首先，我们来看看最热门模型的趋势。最新数据显示，Gemini-2.0-Flash 排在首位，其次是 Claude-Sonnet-4，然后是 Gemini-2.5-Flash-Preview-0520。

排在第 4 位和第 5 位的分别为 DeepSeek V3 0324 的免费版和付费版，如果将两者的使用量加在一起，DeepSeek-V3 的使用量可能达到第二名的水平。

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

此外，我们还可以从趋势图中得出一些独特的观察结论：

2025 年第一季度，AI 出现绝对的爆发式增长，2025年第一季度 OpenRouter 的总 Token 使用量相较于上一季度增长四倍，之后稳定在每周 2T Token 的水平。此后没有再显著增长的情况。
其他模型的用量在第一季度爆发后，稳定在了 600-700B Token 的使用量。这个情况在一定程度上反映了市场需求的多样性，庞大的长尾量证明了模型市场的活跃度，以及存在细分需求。
DeepSeek-V3 自发布以来，一直稳定在 Top 10 中，用户留存率极高。
Gemini-2.0-Flash 因为其低定价（输出每百万 Token 0.4 美元）、大容量和速度快等特点，保持了非常稳定的使用量，一直排在模型用量的前三位。
Gemini-2.5-Flash 势头强劲，考虑到它很可能在价格下降后取代 Gemini-2.0-Flash，谷歌的模型策略定位非常好。
Gemini-2.5-Pro 取代了之前的实验版本，但使用量没有显著增长。
Claude-3.5-Sonnet 在今年 3 月底完成了其历史使命，而 Claude-3.7-Sonnet 也正接近其生命周期的尾声。
Claude-Sonnet-4 现在已经接替了之前 Claude 系列模型的市场位置，但其使用量保持稳定，没有持续显著增长。
OpenAI 的模型无法保证每周使用量能有一款稳定保持在 Top 10。
GPT-4o-mini 的使用量波动很大，尤其是在 5 月份表现突出，可能源自于 OpenAI 市场营销的结果。

谷歌 Gemini 系列稳居市场份额第一，

OpenAI 波动明显

市场份额方面，谷歌以 43.1%的份额稳居第一，DeepSeek 和 Anthropic 分别以 19.6%和 18.4%的份额占比位列第二和第三。

从市场份额数据中，我们发现：

谷歌目前正在强势挤压属于 Anthropic 的市场份额。

DeepSeek 自 DeepSeek-V3 发布以来，一直保持着一定的市场份额，并且在持续扩大。

OpenAI 的份额波动尤其剧烈，尽管排名第四，但和前一名 Anthropic 差距显著。

Llama 的份额持续萎缩，已缩减至其峰值的约五分之一。

其他模型的总份额占比不超过 10%。

专注于微调模型的组织 Gryphe 已经在排名上消失了，Gryphe 基于 llama2 模型微调的 MythoMax13B 模型曾一度在 AI 角色扮演场景中特别受欢迎。

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

四家巨头分占不同细分领域

在细分领域模型的用量数据方面，我们发现：

在编程领域，Claude-Sonnet-4 是绝对的领先者，占据 44.5%的份额，其次是 Gemini-2.5-Pro。
在文本翻译领域，Gemini-2.0-Flash 占据绝对优势，主要是源于其用量大、价格实惠且速度快。此外，还有一个令人惊讶的发现是，排名中除了第二名占据 20%份额的模型外，前几名中有七款都是谷歌的模型。推测部分翻译软件可能已经默认集成谷歌模型。
在角色扮演领域，市场呈现高度碎片化的现状，小众模型合计占据 26.6%的份额。其次是 DeepSeek 凭借高幻觉倾向，在角色扮演领域领先。第三名则是价格实惠、用量大的 Gemini-2.0-Flash。
在营销领域，GPT-4o 是无可争议的绝对领先者，拥有 32.5%的份额，这可能反映了 OpenAI 在非编程专业领域的训练相当有效，用户确实很喜欢 GPT-4o 的输出。

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

编程领域的模型调用量

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

翻译领域的模型调用量

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

角色扮演领域的模型调用量

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

市场营销领域的模型调用量

API 接口使用趋势：

代码编写工具占据主流

最后，来看看大家在 OpenRouter 上主要使用哪些接口（界面）：

排在前两名的是 Cline 和 RooCode，两者都主要用于编写代码。
第三名是 liteLLM，这是一个用于构建各种应用程序的路由库。
第四名 KiloCode，同样是用于编写代码。
第五名是 SillyTavern，这是一个类似于 Ollama 的本地大型语言模型（LLM）接口，可以通过它连接并与大模型进行交互。

2025上半年大模型使用量观察：Gemini系列占一半市场份额，DeepSeek V3用户留存极高

总体观察

基于以上数据观察，我们得出了几点结论：

目前，谷歌几乎占据了大模型 API 市场近一半的份额，其解决方案模型覆盖多个领域，甚至包括价格实惠、价值高的 Gemini-2.0-Flash（比 DeepSeek 更便宜）。
Anthropic 则专注于编程领域，其 Claude-3.5、Claude-3.7 和 Claude-4 模型实现了新旧版本之间的平稳过渡。
OpenAI 在大模型 API 市场的表现并不强势，可能由于多种限制因素，比如最新版的模型需要在其官网申请 AccessKey，或者定价问题等。
DeepSeek 模型拥有强大的用户粘性。令人惊讶的是，DeepSeek-V3 在市场中最受欢迎而不是 DeepSeek-R1，可能是由于 DeepSeek-R1 可能需要过长的处理时间，首个有效 Token 输出过慢，导致用户量不如 V3。
Meta 的 Llama 系列模型已经日渐式微。
Mistral AI 的模型出人意料地占据了大约 3%的市场份额，就我个人接触到 Mistral AI 用户的范围相对有限，主要是一些喜欢微调开源模型的欧洲用户。
X-AI 的 Grok 系列模型虽然取得了一些进展，但市场定位不明确。如果 X-AI 的目标是成为 SOTA 模型，那他们还有很长的路要走。
通义千问（Qwen）系列模型占据了 1.6%的市场份额，需要继续努力。

文章来自公众号“Founder Park”

关键词: AI , AI数据 , 大模型API消耗数据 , 模型占有率数据

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点，无需魔法付费，即可无限制使用GPT-4o等多个海外模型产品。
在线使用：https://ffa.chat/

微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台，可以对大语言模型（LLM）和多模态图文模型（VLM）进行预训练和轻量级微调。XTuner 支持多种微调算法，如 QLoRA、LoRA 和全量参数微调。
项目地址：https://github.com/InternLM/xtuner