2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高
7093点击    2025-07-09 15:30

2025 年已经过半, 文本生成大模型是否已经进入下半场了? OpenAI 完全不重视 API 市场? Grok3 根本没人用? 「大模型战」未来的走向如何?


近期,推特博主「karminski-牙医」发布了一篇关于 2025 年上半年大模型 API 市场数据分析帖子,基于 OpenRouter 数据,「karminski-牙医」分析了上半年大模型的总 Token 使用量排名及趋势、不同大模型的市场份额占比、细分领域模型的应用偏好、以及 API 接口使用趋势,得出了一些非常有趣的观察结论。以下为具体分析内容。


来源:https://x.com/karminski3/status/1942612077241311386


01

一季度 AI 总 Token 使用量增长近 4 倍,

存在活跃长尾需求


首先,我们来看看最热门模型的趋势。最新数据显示,Gemini-2.0-Flash 排在首位,其次是 Claude-Sonnet-4,然后是 Gemini-2.5-Flash-Preview-0520。


排在第 4 位和第 5 位的分别为 DeepSeek V3 0324 的免费版和付费版,如果将两者的使用量加在一起,DeepSeek-V3 的使用量可能达到第二名的水平。


2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高


此外,我们还可以从趋势图中得出一些独特的观察结论:


  • 2025 年第一季度,AI 出现绝对的爆发式增长,2025年第一季度 OpenRouter 的总 Token 使用量相较于上一季度增长四倍,之后稳定在每周 2T Token 的水平。此后没有再显著增长的情况。
  • 其他模型的用量在第一季度爆发后,稳定在了 600-700B Token 的使用量。这个情况在一定程度上反映了市场需求的多样性,庞大的长尾量证明了模型市场的活跃度,以及存在细分需求。
  • DeepSeek-V3 自发布以来,一直稳定在 Top 10 中,用户留存率极高。
  • Gemini-2.0-Flash 因为其低定价(输出每百万 Token 0.4 美元)、大容量和速度快等特点,保持了非常稳定的使用量,一直排在模型用量的前三位。
  • Gemini-2.5-Flash 势头强劲,考虑到它很可能在价格下降后取代 Gemini-2.0-Flash,谷歌的模型策略定位非常好。
  • Gemini-2.5-Pro 取代了之前的实验版本,但使用量没有显著增长。
  • Claude-3.5-Sonnet 在今年 3 月底完成了其历史使命,而 Claude-3.7-Sonnet 也正接近其生命周期的尾声。
  • Claude-Sonnet-4 现在已经接替了之前 Claude 系列模型的市场位置,但其使用量保持稳定,没有持续显著增长。
  • OpenAI 的模型无法保证每周使用量能有一款稳定保持在 Top 10。
  • GPT-4o-mini 的使用量波动很大,尤其是在 5 月份表现突出,可能源自于 OpenAI 市场营销的结果。



02

谷歌 Gemini 系列稳居市场份额第一,

OpenAI 波动明显


市场份额方面,谷歌以 43.1%的份额稳居第一,DeepSeek 和 Anthropic 分别以 19.6%和 18.4%的份额占比位列第二和第三。

从市场份额数据中,我们发现:


  • 谷歌目前正在强势挤压属于 Anthropic 的市场份额。


  • DeepSeek 自 DeepSeek-V3 发布以来,一直保持着一定的市场份额,并且在持续扩大。


  • OpenAI 的份额波动尤其剧烈,尽管排名第四,但和前一名 Anthropic 差距显著。


  • Llama 的份额持续萎缩,已缩减至其峰值的约五分之一。


  • 其他模型的总份额占比不超过 10%。


  • 专注于微调模型的组织 Gryphe 已经在排名上消失了 ,Gryphe 基于 llama2 模型微调的 MythoMax13B 模型曾一度在 AI 角色扮演场景中特别受欢迎。

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高



03

四家巨头分占不同细分领域


在细分领域模型的用量数据方面,我们发现:


  • 在编程领域,Claude-Sonnet-4 是绝对的领先者,占据 44.5%的份额,其次是 Gemini-2.5-Pro。
  • 在文本翻译领域,Gemini-2.0-Flash 占据绝对优势,主要是源于其用量大、价格实惠且速度快。此外,还有一个令人惊讶的发现是,排名中除了第二名占据 20%份额的模型外,前几名中有七款都是谷歌的模型。推测部分翻译软件可能已经默认集成谷歌模型。
  • 在角色扮演领域,市场呈现高度碎片化的现状,小众模型合计占据 26.6%的份额。其次是 DeepSeek 凭借高幻觉倾向,在角色扮演领域领先。第三名则是价格实惠、用量大的 Gemini-2.0-Flash。
  • 在营销领域,GPT-4o 是无可争议的绝对领先者,拥有 32.5%的份额,这可能反映了 OpenAI 在非编程专业领域的训练相当有效,用户确实很喜欢 GPT-4o 的输出。

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高


编程领域的模型调用量


2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高


翻译领域的模型调用量


2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高



角色扮演领域的模型调用量


2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高



市场营销领域的模型调用量



04

API 接口使用趋势:

代码编写工具占据主流



最后,来看看大家在 OpenRouter 上主要使用哪些接口(界面):


  • 排在前两名的是 Cline 和 RooCode,两者都主要用于编写代码。
  • 第三名是 liteLLM,这是一个用于构建各种应用程序的路由库。
  • 第四名 KiloCode,同样是用于编写代码。
  • 第五名是 SillyTavern,这是一个类似于 Ollama 的本地大型语言模型(LLM)接口,可以通过它连接并与大模型进行交互。

2025上半年大模型使用量观察:Gemini系列占一半市场份额,DeepSeek V3用户留存极高


05

总体观察


基于以上数据观察,我们得出了几点结论:


  • 目前,谷歌几乎占据了大模型 API 市场近一半的份额,其解决方案模型覆盖多个领域,甚至包括价格实惠、价值高的 Gemini-2.0-Flash(比 DeepSeek 更便宜)。
  • Anthropic 则专注于编程领域,其 Claude-3.5、Claude-3.7 和 Claude-4 模型实现了新旧版本之间的平稳过渡。
  • OpenAI 在大模型 API 市场的表现并不强势,可能由于多种限制因素,比如最新版的模型需要在其官网申请 AccessKey,或者定价问题等。
  • DeepSeek 模型拥有强大的用户粘性。令人惊讶的是,DeepSeek-V3 在市场中最受欢迎而不是 DeepSeek-R1,可能是由于 DeepSeek-R1 可能需要过长的处理时间,首个有效 Token 输出过慢,导致用户量不如 V3。
  • Meta 的 Llama 系列模型已经日渐式微。
  • Mistral AI 的模型出人意料地占据了大约 3%的市场份额,就我个人接触到 Mistral AI 用户的范围相对有限,主要是一些喜欢微调开源模型的欧洲用户。
  • X-AI 的 Grok 系列模型虽然取得了一些进展,但市场定位不明确。如果 X-AI 的目标是成为 SOTA 模型,那他们还有很长的路要走。
  • 通义千问(Qwen)系列模型占据了 1.6%的市场份额,需要继续努力。



文章来自公众号“Founder Park”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/

2
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner