100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流
5592点击    2025-12-22 17:05

前言


之前我在这篇文章(超全面免费 AI  API 分享!零成本开启你的AI之旅!)中介绍过 OpenRouter 这个大模型 API 聚合平台,最近他们通过分析了100 万亿 token用户真实数据,发布了一篇研究报告,反应了真实用户的大模型使用现状。100 万亿 token 是什么概念呢?是人类所有文字资料的好几倍,这个数据量非常有说服力。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流


原文链接如下:https://openrouter.ai/state-of-ai ,感兴趣的朋友可以看看。我看完后大为震惊,原文很长而且是英文,如果你没时间看原文的话,可以看我这篇文章,可能会颠覆你对 AI 行业的很多认知。


2025 年中国开源模型势不可挡


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流


在过去一年,闭源模型占据 70% 左右的 token 消耗量,而开源模型始终保持在 30%左右,其中来自中国的开源模型的迅速发展,从 2024 年底忽略不计的调用量(周份额低至 1.2%),到 2025 年下半年快速发展到 13.7% 周调用量,在模型发布周的时候(例如 Kimi K2、 Qwen3 Coder 等模型),周调用量甚至达到30% 之多!


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流


在年度开源模型 token 消耗量前十名的厂商里,来自中国的厂商占据了半壁江山,分别是 DeepSeek(深度求索) 、Qwen(千问)、Minimax、Z-AI(智谱)、MooshotAI(月之暗面),而 DeepSeek 更是以 14.37 万亿年度总消耗量领先所有开源模型。在今年上半年 DeepSeek 更是占据了绝大部分 token 消耗量。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 3 开源模型规模与使用情况。小型、中型和大型模型在每周开源总token使用量中的占比。


但值得关注的是,随着 GLM 4.5、Kimi K2 、MiniMax M2 等模型加入竞争,到了 2025 年年末,没有哪个模型的 token 消耗量超过 25%,这预示着开源模型若停滞不前,往往会被快速迭代或针对特定领域微调的模型取代


2025 是 Agent 元年


模型不再只是用来生成文本,而是被用于规划、工具调用或在更长的上下文中进行交互来采取行动。目前推理模型的 token 消耗占到了所有 token 消耗的一半以上,随着 GPT-5、Claude 4.5 和 Gemini 3 等更高能力模型的发布,扩展了用户对逐步推理所能达到的预期,用户也越来越偏好能够管理任务状态、遵循多步骤逻辑并支持代理式工作流的模型,而不仅仅是生成文本


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流


伴随着各种 Agent 的发展,模型工具调用的频率在持续增高,从年初的几乎不计,到年底快速增长至 15%。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 12 工具调用


用户的提示词越来越长。相比 2024 年,提示词的 token 数量增长到了 4 倍以上。如今的用户请求不再是开放式的生成(如“给我写一篇文章”),而是对用户提供的庞大材料(代码库、文档、笔记、长对话等)进行推理,并产出精炼、高价值的洞见。模型越来越像分析引擎,而非创意生成器。尤其涉及代码理解、调试与生成的请求通常超过 20K 输入 token,而所有其他类别任务的请求始终保持相对平稳且体量较小的 token 输入。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 14 提示词Token数量正在上升。平均提示词长度自2024年初以来增长了近四倍。


用户于模型对话长度更长,编程任务的对话长度显著长于其他任务。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 17 每次生成平均 token 数(提示+补全)


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 18 编程中的对话长度与整体相比。编程提示词更长且增长更快。


综合上面的趋势(推理占比上升、工具使用范围扩大、提示词变得更长更复杂、对话长度提升等)表明,大语言模型的使用重心已发生转移。如今,典型的大模型请求不再是一个简单的问题或孤立的指令,而是结构化、多次模型交互的一部分调用外部工具、对状态进行推理,并在更长的上下文中持续存在


这意味着我们从人驱动 AI 慢慢过度到,「AI 自我推理自我执行任务」的阶段,AI 可以自己拆解任务、调用工具、迭代验证结果


大家都用大模型来干什么?编程独占鳌头


总体而言,编程任务消耗了大部分的 token,其中 Anthropic 家族模型占用 60% 左右编程任务 token 消耗量。这也跟我身边的观察非常一致,大部分程序员喜欢用 Claude 家族模型辅助编程。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 19 编程任务的占比在不断提升。所有被归类为编程的 LLM 查询的占比持续上升,反映出 AI 辅助开发工作流的兴起。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 20 各模型提供商的编程请求占比。Anthropic 的模型占据最大份额。


很有意思的是「角色扮演」任务也占据了不小的比例(见图 19),在所有任务中排在了第二位,用户尤其是喜欢使用开源模型进行创意类的互动对话(如讲故事、角色扮演和游戏场景等),原因是开源模型有更少的内容限制,这对一些互动类游戏应用、角色扮演类应用尤为重要。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流


用户留存率的「灰姑娘效应」


所谓的「灰姑娘效应」是指:当用户发现某个模型非常契合自己的工作流,他就会一直使用该模型,就像灰姑娘的高跟鞋,只有灰姑娘最合脚。报告中还发现以下几个现象:


  • 先发优势:当一个 AI 模型率先解决某个重要问题时,就获得了巨大的先发优势,早期用户会把这个模型深度整合到自己的工作流程、技术系统和日常使用习惯中,一旦用习惯了,用户就不想换了,因为转换成本太高了。这样就形成了一个稳定的局面:即使后来出现更好的替代品,老用户还是愿意继续用原来的模型
  • 留存率体现模型是否有突破性进步:当一个 AI 模型能在早期用户中保持长期使用,说明这个模型在某些任务上实现了重大突破。如果没有这种持续使用现象,说明各家模型水平差不多,没有本质区别
  • 抓住用户的"黄金窗口"很短暂:AI 竞争很激烈,每个模型只有很短的时间来吸引核心用户,随着其他模型快速追赶,新模型吸引忠实用户的机会越来越小。


成本与使用量的关系


模型的成本是影响用户行为的关键因素,翻译这种简单的任务用户倾向是使用价格便宜的模型,而编程这种消耗量大对模型性能又有一定要求的任务,用户会选择价格适中的模型。


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

 △ 图 26 成本和用量根据任务分类


同时报告发现,用户更在乎模型的效果而不是价格,并不会因为某款模型的调用价格更便宜


100万亿Token揭示真相:中国开源AI拿下30%全球份额,推理已成主流

△ 图 26 闭源模型集中在高成本、高使用象限,而开源模型则主导低成本、高高使用区域。虚线趋势线几乎平坦,显示成本与总使用量之间相关性有限。


这揭示了AI 模型定价新逻辑:便宜不是王道,适配才是关键!


开源模型几乎免费调用,为什么开发者却不愿意深度集成?答案很简单:找不到合适的用例


就像谷歌推出的 Gemini 系列,Flash 主打"快而省",Pro 专注"强而精"——这种分层策略正在重塑 AI 市场。厂商们不再纠结于"每个 token 多少钱",而是转向更聪明的思考:"每次成功任务要花多少钱"?


市场正在分层:


  • 轻量级任务?选择便宜快速的模型
  • 核心业务场景?投入更强大的模型
  • 对延迟敏感?优先考虑速度优化


生产环境的真相: 企业更愿意选择"快而准"的专用模型,而不是"便宜但不稳定"的通用模型。当任务结果的质量比省几毛钱更重要时,可靠性和适配度就成了决胜因素


这告诉我们:AI 模型远未成为"大路货"。用户愿意为更好的体验、更强的能力、更稳定的服务买单。差异化价值依然存在,而且比以往任何时候都更重要。


总结


🔄 没有永远的王者,开源闭源平分天下 AI 江湖群雄并起,没有一家独大。对开发者来说,别把鸡蛋放一个篮子——要灵活搭配多种模型,为不同任务选择最优解。对模型厂商而言,警惕来自角落的挑战,社区模型随时可能抢走你的地盘,除非你持续创新。


🎭 超一半用户用 AI"聊天",不是"干活" 颠覆认知!超过一半的开源模型使用者,竟然是在角色扮演和讲故事。早期 ChatGPT 用户也是先玩后用,从娱乐逐渐转向生产力。这打破了"AI 主要是生产力工具"的假设——很多人要的是陪伴和探索,不是效率。


🤖 AI 进化:从"一问一答"到"多步推理" AI 不再是简单的问答机器,而是智能化的执行者。它会规划、推理、调用工具、访问数据,通过多轮迭代完成任务。评估标准也在转变:从"话说得好不好"到"事情办得怎么样"。下一个战场:谁能持续高效地推理,谁就赢得未来。


💰 市场未"白菜化",质量仍为王道 AI 远未成为廉价商品。用户在成本与质量、可靠性之间做权衡。闭源模型主导高价值业务,开源模型称霸低成本场景——价格战打不赢,价值战才是关键。


👟 留存才是护城河,找到"水晶鞋"就赢了 基础模型飞跃式进步,用户留存成为真正的护城河。每次技术突破都是短暂的机遇窗口,找到完美契合高价值场景的"水晶鞋",用户就会深度绑定。


对创业者和投资者来说,别只盯着增长曲线,要看留存曲线。那些即使模型更新也坚守的核心用户,才是真正的财富。在这个瞬息万变的市场,谁先抓住未满足的关键需求,谁就能在下一波技术浪潮中存活。


👨‍💻 个人观点


相比 2024 年,我最大的感受是开源大模型能力的井喷,从年初 DeepSeek 一炮而红,到今年下半年,KIMI K2、MiniMax M2、gpt-oss-120b 等模型陆续推出,开源模型凭借跟顶级闭源模型相近的能力、更低的调用成本、更开放的生态俘获了不少用户的芳心,中国厂商在开源大模型领域更是遥遥领先,放两年前这肯定是不敢想象的。


2025 年也是 AI Agent 元年,标志着人工智能从单纯的工具向自主智能体的重大转变。在 AI Agent 的落地实践中,编程任务作为一个关键应用场景,已取得显著的成效表现(从上面报告 token 消耗量也能看得出),我在这一年也用了非常多的 Coding Agent 产品:Cusror、Windsurf、Claude Code、Codex,也切身体会到了 Agent 的强大,改变了我日常编程的流程和范式。2026年AI Agent 也会在其他领域大放异彩。


文章来自于“DeBill独立开发”,作者 “DeBill”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
AI数据分析

【开源免费】DeepBI是一款AI原生的数据分析平台。DeepBI充分利用大语言模型的能力来探索、查询、可视化和共享来自任何数据源的数据。用户可以使用DeepBI洞察数据并做出数据驱动的决策。

项目地址:https://github.com/DeepInsight-AI/DeepBI?tab=readme-ov-file

本地安装:https://www.deepbi.com/

【开源免费airda(Air Data Agent)是面向数据分析的AI智能体,能够理解数据开发和数据分析需求、根据用户需要让数据可视化。

项目地址:https://github.com/hitsz-ids/airda

4
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

5
微调

【开源免费】XTuner 是一个高效、灵活、全能的轻量化大模型微调工具库。它帮助开发者提供一个简单易用的平台,可以对大语言模型(LLM)和多模态图文模型(VLM)进行预训练和轻量级微调。XTuner 支持多种微调算法,如 QLoRA、LoRA 和全量参数微调。

项目地址:https://github.com/InternLM/xtuner

6
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0