DeepSeek V4-Flash登顶OpenRouter全球调用榜

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
DeepSeek V4-Flash登顶OpenRouter全球调用榜
6153点击    2026-05-27 09:14

最近,DeepSeek又刷屏了!


根据 OpenRouter最新数据测算,5月18日至 5月24日,全球AI大模型总调用量达到 28.9 万亿Token,整体需求仍在快速释放。其中,中国AI大模型周调用量达 9.22万亿Token,环比增长19.89%;美国AI大模型周调用量为4.93万亿Token,环比增长16.27%。


值得注意的是,中国大模型调用量已连续 4 周超过美国。其中,DeepSeek V4-Flash登顶OpenRouter全球调用榜,其旗下模型周调用总量达到 5.74万亿Token,超过Anthropic与Google,连续两周位居全球第一。


流量不会说谎。每一笔背后,是开发者用真实需求投出的票。当调用量持续沉淀,生态粘性、数据飞轮与定价权,也是悄然成形。


价格的红线、性能的标尺、算力的边界……整个大模型行业的生存游戏规则,正在被DeepSeek悄悄改写。


01

V4-pro永久降价,每百万Tokens输入仅需2.5分钱


5月22日,DeepSeek官方宣布,其旗舰模型 DeepSeek-V4-Pro 的 API 价格将永久下调至原价的四分之一,再次刷新全球大模型API的最低价格纪录。


登顶 OpenRouter之后,DeepSeek仍在悄悄加速

来源:deepseek


根据最新定价,在持续至2026年5月31日的2.5折优惠结束后,价格将转为长期固定方案:输入(缓存命中)0.025元/百万tokens,输入(缓存未命中)3元/百万tokens,输出6元/百万tokens。整体来看,大模型调用成本进一步下探到接近基础设施级别的区间,使高频调用场景的成本压力被明显削弱。


降价消息传出后,开发者社区的讨论迅速升温,很多人将其视为大模型进入“token成本普惠阶段”的重要信号。更低的调用成本,意味着AI应用在长链路推理、高频交互以及大规模 Agent 场景中的边际成本被显著压缩,从而进一步降低了产品验证与规模化落地的门槛。


这其实DeepSeek所坚持的路径也基本一脉相承。一方面,新一代模型架构带来的推理效率提升,持续压低单位算力成本;另一方面,其长期坚持的成本定价策略,使价格更贴近真实计算成本,而非以溢价方式驱动商业回报。早在 2024 年 DeepSeek V2 降价时,梁文锋就提到,DeepSeek 只是按照自己的节奏做事,核算成本后定价,原则是不贴钱,也不赚取暴利。他还说,降价一部分来自下一代模型结构探索带来的成本下降,另一部分原因是 API 和 AI 都应该是普惠的、人人用得起的东西。


如今,DeepSeek的价格优势被进一步放大。在第三方测算中,在相同任务复杂度下,DeepSeek V4-Pro 的平均调用成本约为 GPT-5.5 的十分之一,也仅约为 Claude Opus 4.7 的十一分之一。


02

融资700亿,直指AGI


除了价格的优势,DeepSeek也在加强融资布局。


据彭博社报道,DeepSeek 正在推进一轮规模高达 700 亿元人民币(约合 100 亿美元)的融资。创始人梁文锋在与投资者的沟通中表示,公司将把突破性AI研究置于短期商业化之前,并以实现通用人工智能作为最终目标。


在此轮融资中,国家集成电路产业投资基金(国家大基金)被指正在商议参与,拟出资约100亿元人民币。同时,腾讯控股、IDG Capital、砺思资本等机构也被认为接近参与。本轮融资中,梁文锋本人或将投入最高约200亿元人民币,成为重要投资方之一。


充足的资金弹药,使DeepSeek在维持低价API策略的同时,具备向更前沿方向持续扩张的能力,而其最新动向,正明显指向Agent赛道。


登顶 OpenRouter之后,DeepSeek仍在悄悄加速

来源:deepseek


近期,DeepSeek在官网及小红书等平台宣布,将组建一支名为“Harness”的新团队,方向为代码 AI 智能体产品。在官方定义中,DeepSeek提出核心公式:Model + Harness = Agent。其中,Model负责理解与生成,Harness则作为连接模型与真实工程环境的执行系统,承担输入输出管理、本地代码执行、结果验证与错误收敛等关键职责,使模型能力从“生成”升级为“可执行任务”。


据悉,今年3月加入DeepSeek的前TSY Capital联合创始人崔添翼,被外界认为可能出任该团队负责人。目前,该团队正在北京密集招聘产品经理、工程研发、算法研究及数据策略等复合型人才,并要求候选人深度理解 Claude Code、Cursor、GitHub Copilot 等前沿工具的工作机制。


从目标来看,Harness团队的短期任务十分清晰:打造一款对标 Anthropic Claude Code 的桌面端编程Agent产品,将DeepSeek V4系列强大的原生代码能力,系统性转化为真正融入开发者日常工作的生产力工具。


但这一方向的核心挑战,从来不在于代码生成本身,而在于如何在复杂真实工程环境中持续、稳定地执行任务。这要求系统具备低延迟反馈、流程闭环与风险控制能力,其工程逻辑与量化交易系统在底层范式上高度相似。


而作为国产模型,DeepSee拥有天然的优势。极低的Token与缓存价格大幅降低了Agent的运行成本,吸引了海量开发者涌入,而Code Harness引导模型进入真实的开发环境,产生的高质量工作流数据又会反过反哺大模型的迭代优化。


一手拿着全行业最低价的API在全球范围内无差别吸粉,一手握着百亿美金融资钻研前沿AGI,同时重兵组建Harness团队占领AI程序员这个场景,DeepSeek正在构建一个自我强化的闭环。


03

多模态,DeepSeek其实默默补上了


相较于当前主流大模型普遍已经进入多模态竞争阶段,DeepSeek在产品形态上仍以文本与代码能力为核心,多模态的形式相对较弱,但其实它也在悄悄补上了。


但就在5月9日,DeepSeek已经正式大规模开放了“识图模式”内测。这意味着它已经具备了原生的图像理解能力,包括文档OCR识别、图表信息提取、基于图像的交互问答等。虽然起步比GPT-4o晚,但DeepSeek在保持极高算力性价比的同时,已经补齐了多模态这块关键短板。


按照行业发展的趋势,一旦大模型从文本扩展到图像与跨模态输入,并叠加复杂Agent执行能力,模型价值往往会出现非线性放大。如果未来DeepSeek在现有基础上进一步引入稳定的多模态能力,并将其与自身低成本推理体系结合,那么其在Agent生态中的位置可能不仅是“性价比最高的语言模型”,而可能成为覆盖更广任务形态的基础智能引擎。


04

华为“韬定律”迎战算力封锁

DeepSeek 搭载国产芯片奋力破局


长期以来,全球AI行业始终沿着这样的路径前行:更强的模型,需要更大的算力支撑;更强的算力,则需要更先进的芯片。而全球AI算力体系,又长期由海外巨头垄断,从高端GPU的硬件垄断到CUDA体系的生态绑定,构筑起了极高的资本壁垒。很长一段时间,行业陷入了这样的焦虑,认为缺乏海外最顶尖的单卡硬件,本土大模型产业就无法冲刺通用人工智能。


然而,破局者往往可另辟蹊径。在DeepSeek的逻辑里,条条大路通皆可罗马,此路不通并不意味着满盘皆输,而是意味着必须开辟一条成本更低、效率更高、完全绕过既定规则的反常规范式。这是后来者居上的创新路径,也正成为中国科技创新的范式路径。


在最新发布的DeepSeek V4中,这种软硬件协同的破局能力得到了集中释放。大模型在处理长上下文、代码库分析及Agent自动化任务时,最核心的物理瓶颈在于显存带宽与容量受限。为了打破这一制约,DeepSeek搭乘国产芯片能力,通过独创的MLA,利用低秩压缩技术大幅降低KV Cache占用,将缓存压缩率提升数倍。这意味着,在相同的显存与硬件条件下,全栈国产算力集群也能高效运行更长上下文、更复杂的深度任务,直接用软件算法绕过了过去被视为核心限制的显存瓶颈。


登顶 OpenRouter之后,DeepSeek仍在悄悄加速

来源:X


这种极致优化的战略野心,绝非局限于与其他模型厂商的存量博弈。正如X平台博主@bookwormengr在《DeepSeek's 10 trillion USD grand strategy(DeepSeek 的十万亿美元棋局)》中所指出的,DeepSeek的真正目标是通过持续降低训练和推理的底层资源需求,推动一套更低成本、更分散的去中心化AI硬件生态逐渐成形。在这一逻辑下,DeepSeek的价值不再只是单一的模型能力,而是利用其庞大的用户黏性与极低的Token成本,强力拉动国产存储、异构GPU、ASIC、网络芯片以及更多异构硬件全面进入大模型体系,重构整个产业的供应链闭环。


无独有偶,华为创新提出的“韬(τ)定律”,则开辟了另一种突围路径。面对先进制程受限的客观现实,“韬定律”不再一味盲从将晶体管做得越来越小的物理微缩路径,转而另辟蹊径,通过系统性压缩信号在芯片各层级、集群各节点中的传播时间,在时延的极限对齐中寻找到了全新的性能增量。


基于这一定律,华为在过去6年内已成功设计并量产了381款芯片,全面覆盖人工智能、汽车、工业、基础设施等多个关键领域,从工业级层面上强有力地验证了用系统级时延压缩替代物理制程内卷的战略可行性。据华为预测,到2031年,基于“韬定律”的高端芯片晶体管密度将达到1.4纳米制程的同等水平。这意味着,无需依赖极致的微缩物理制程,国产芯片即可实现性能与能效的持续跨越与全面跃升。


目前,DeepSeek的算法工程已与华为的算力底座实现深度适配,可以预见,当这种软硬件全栈闭环彻底完成,这条反其道而行之的行业生存线,正在给全球人工智能产业确立一套全新的中国标准。


文章来自于"前方智能",作者 "小鱼"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md

4
免费使用GPT-4o

【免费】ffa.chat是一个完全免费的GPT-4o镜像站点,无需魔法付费,即可无限制使用GPT-4o等多个海外模型产品。

在线使用:https://ffa.chat/