国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型U2，再次捅破行业天花板

10096点击 2026-06-08 20:56

一场迟到但惊艳的“自我正名”。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

▲鼠标点击烟花

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

▲多摆混沌系统模拟器

以上这些，都是用云知声最新发布的U2大模型做出来的。

智东西6月8日报道，今天，“港股AGI第一股”云知声发布其最新通用大语言模型U2，该模型是由云知声自研的、基于快慢思考融合的MoE（混合专家）范式构建的通用大语言模型。U2跳出了传统大模型盲目堆参数、堆Token的内卷路径，实现了“小参数强能力、少Token高产出、低算力低成本”的进化。

只从基准测试上看，云知声U2就已经跻身国产大模型第一阵列了。

长上下文能力上，U2在AA-LCR评测中得到70分，在对比模型中排在首位，比第二名的MiniMax M2.5/M2.7高出0.5分。知识与推理上，U2也以87.9分的成绩领跑。指令遵循能力方面，U2同样表现突出，IFBench得分77.3分，比第二名的GLM-5.1高出1分。

智能体能力方面，U2在SWE-Bench Verified评测中取得75分，排名第三。Claw-Eval（pass@3）方面，U2获得76.9分，排名仅次于MiniMax M2.5/M2.7。在面向真实办公与知识工作交付能力的GDPval上，U2取得72.5分，展现出扎实的专业办公能力。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

提到云知声，许多人的第一反应或许还停留在“那家主攻语音技术的科技公司”。然而，从2012年成立之初深耕智能语音交互，到如今的原生智能体大模型公司，云知声早已寻找到了最适合自己的那条路，完成了蜕变。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

自动生成俄罗斯方块

2分钟做出大宗商品研报

云知声团队告诉智东西，在当下这个时间衡量今天的大模型价值，已经不能再单纯比拼参数规模和内容生成长度。当AI真正进入真实工作流，用户关心的不再只是模型能否给出一个漂亮回答，而是它能否真正把任务完成。

因此，云知声U2从设计之初，就不是一个单纯面向聊天场景的通用模型，而是一款有着近3000亿参数、面向任务执行的原生智能体大模型。

U2具备长程工作编排与自主纠错能力，这意味着它可以像一位高级工程师那样，把一个复杂任务拆解成多个子步骤，按序执行，并在过程中自我校验、自动修正。

比如编程任务，U2不仅能完成后端逻辑，还能胜任前端全流程开发：从项目功能开发、页面排布到视觉方案设计，均可端到端落地。

我让U2生成一个新产品发布倒数页面，要求包含邮箱信息填写和各个平台联系方式的互动按钮。几乎没有反应时间，它就直接交付了内容清晰、可运行的页面。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

这套长程编排与自主纠错机制，也让U2能够独立完成虚拟系统、游戏等完整应用的交付。例如，用户不需要输入完整的游戏逻辑，U2就可以自动搜索相关条件，生成一个符合要求且可玩度很高的俄罗斯方块小游戏。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

面对复杂的知识工作，U2同样不靠简单拼接信息。它具备跨行业数据检索、多源信息清洗与专业文献深度结构化分析的能力，能够并行调用多个工具，将零散、异构的数据整合为有逻辑、有结论的分析结果。

我交给了U2一个十分艰巨的任务：

“分析2026年5月原油、黄金、铜、农产品等大宗商品走势，结合地缘政治、供需关系、美元指数、库存数据，判断短期价格波动与中长期趋势。”

这个任务不仅需要对当下地缘政治局面十分了解，还要理解地缘政治与大宗商品的内在逻辑关系，需要扎实的历史知识和金融知识。

面对这个综合金融问题，U2几乎没有反应时间，自动调取了所需的网页检索和分析工具，在一两分钟内就洋洋洒洒生成了一篇超5000字、带数据表格的分析报告，展现出十分强大的深度结构化分析能力。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

除此之外，U2还通过Agentic Harness（智能体编排框架）精准落地各项办公任务。无论是生成报告、分析数据，还是写周报月报这类琐碎工作，U2都能自动理解指令、编排执行路径，给打工人卸下不少负担。

用户只需一句“帮我写一下本周的周报”，U2就会主动梳理已完成事项、提取关键数据、调用docx技能，并且模型还会自动校验其生成结果的准确度。从结果看来，U2输出的周报文档，结构清晰、内容完整详实，可以直接拿来就用。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

不拼参数拼密度

云知声U2把每一个Token都用在刀刃上

U2模型的核心创新，最终指向一个清晰的目标：让小模型在真实业务场景中展现出超越体积的智能与效率。

这其中，模型的高智能密度和高Token价值就至关重要。

云知声通过对高质量知识数据的深度提纯，实现知识点级的精准萃取与结构化编码，彻底剔除冗余低质信息，让小参数模型获得与超大模型相当的知识承载能力与智能表现。U2采用高效稀疏架构，激活参数仅为总参数量的约十分之一，推理成本与激活参数规模线性锚定，高并发场景下的成本优势尤为突出。

并且，通过优化语义表征与推理路径压缩，技术团队让模型的单个Token承载语义、信息量都远超传统模型，用更少Token完成更复杂任务，大幅降低企业部署的算力门槛与推理延迟。

传统显式思维链虽然具备较强可解释性，但往往需要生成大量中间推理文本，带来更高Token消耗与推理延迟。而隐空间推理，却可能在复杂任务中出现逻辑漂移，缺乏足够的可控性与验证能力。

因此，在复杂推理层面，U2进一步引入了一个十分独特的机制：混合思考机制。

它借鉴人脑解题方式：输出前先在隐藏表征中形成连续思考，在高维空间同步探索多条路径，再映射为后续显式推理，避免将全部中间步骤逐一展开。

其中，U2引入了可控隐空间展开（Bounded Latent Rollout）与熵感知切换（Entropy-aware Switching）机制，使模型能够根据推理过程中的不确定性动态调整思考方式：当隐式探索稳定时，模型保持高效推理；当不确定性升高、推理路径可能发散时，则及时回到显式思维链，通过确定性Token完成精准推导与结果收敛。

这套设计在保留多路径探索与可验证性的同时，还节省了约25%的思考Token消耗。

在任务执行层面，U2使用了Agent-Harness协同训练范式，将模型原生Agent能力提升与Harness迭代优化纳入同一训练闭环：一方面，Harness根据U2的模型特点持续优化任务执行链路；另一方面，真实任务中产生的高质量执行轨迹，又反过来强化模型的任务规划、工具调用、过程纠错和结果验收能力。

总体看下来，U2整套设计的落点非常清晰：用更小的参数、更少的Token、更低的算力，在真实业务场景中交付稳定、可靠、可验证的智能结果。

端云协同叠加场景深耕

云知声走出大模型商业化样本

云知声自2012年创立以来，走出了一条独特的发展道路。

首先，在技术硬实力上，云知声拥有仅少数厂商才具备的全栈AI能力，其不仅能做云端，更能做端侧，实现了端云协同。不同于单纯的模型层厂商，云知声手握“芯片+算力+模型+应用”的完整链条。其自研的“蜂鸟”等系列芯片出货量已超亿颗，这使得云知声在端侧大模型的部署上拥有相当的优势。

国产大模型第一梯队迎新势力：云知声发了个原生Agent大模型，再次捅破行业天花板

其次，在商业化壁垒上，云知声的产品已广泛落地于智慧医疗、智慧交通、智慧生活及物联网（AIoT）等多个领域。

在智慧医疗领域，其产品已在近450家医院实现规模化部署，涵盖病历生成与质控、辅助诊疗及保险和医保监管等场景；在智慧交通领域，产品应用于深圳、广州、青岛等多地地铁及航空枢纽，提供智慧客服、语音购票及智能调度等解决方案；在智慧生活与AIoT领域，通过“芯片+模型”方案，赋能智能家居、智慧座舱、智慧营销等场景，服务众多行业头部企业。

这种在高价值B端场景的扎根，让云知声成为了国产大模型公司中变现能力最强、离盈利最近的那一个。

财报数据也着实证明了这一点。今年3月26日，云知声交出了一张“硬核成绩单”：

该公司2025年营收12.1亿元，同比增长29%；其中大模型相关收入达6.1亿元，同比暴涨1076%，撑起半壁江山。更值得一提的是，其亏损显著收窄，全年经调整净亏损约1.3亿元，同比下降近25%，下半年更是大幅缩窄92%，几近盈亏平衡。

受益于高质量场景Token的需求激增，云知声5月Token调用收入的ARR环比暴涨600%，预计6月将继续保持高增长，ARR达到1500万美元。

这意味着，其收入与客户AI使用强度已关联，云知声业务的规模天花板已经全面打开。

结语：跻身国产大模型第一梯队后

云知声再次捅破行业天花板

站在2026年6月的时间点回望，从2012年以语音技术起家，到2025年登陆港交所，再到如今发布U2大模型，云知声用14年时间完成了从智能交互到AGI的跨越。

云知声的特殊性在于，它从未脱离过产业场景。长达十年的“云端芯”布局，云知声积累了深厚的垂直行业Know-How。U2大模型发布后，立刻就能在智慧医疗、智慧交通、智慧座舱等场景中产生化学反应，成为生产力工具。

U2的发布，不仅是其自身的一次产品迭代，更是国产大模型走向成熟化、产业化的一个缩影。

文章来自于微信公众号 "智东西"，作者 "智东西"

关键词: AI新闻 , 云知声 , Agent大模型 , U2 , 云知声U2

AITNT资源拓展

根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考

AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务，如比较价格、添加购物车、回复各种社交媒体等。
项目地址：https://github.com/browser-use/browser-use

AI工作流

【开源免费】字节工作流产品扣子两大核心业务：Coze Studio（扣子开发平台）和 Coze Loop（扣子罗盘）全面开源，而且采用的是 Apache 2.0 许可证，支持商用！
项目地址：https://github.com/coze-dev/coze-studio

【开源免费】n8n是一个可以自定义工作流的AI项目，它提供了200个工作节点来帮助用户实现工作流的编排。
项目地址：https://github.com/n8n-io/n8n
在线使用：https://n8n.io/（付费）

【开源免费】DB-GPT是一个AI原生数据应用开发框架，它提供开发多模型管理（SMMF）、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL（智能体工作流编排）等多种技术能力，让围绕数据库构建大模型应用更简单、更方便。
项目地址：https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file


【开源免费】VectorVein是一个不需要任何编程基础，任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤，并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。
项目地址：https://github.com/AndersonBY/vector-vein?tab=readme-ov-file
在线使用：https://vectorvein.ai/（付费）

智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的（AI Agents）项目。用户创建的智能体能够自动执行各种任务，从而让AI有步骤的去解决实际问题。
项目地址：https://github.com/Significant-Gravitas/AutoGPT

﻿【开源免费】MetaGPT是一个“软件开发公司”的智能体项目，只需要输入一句话的老板需求，MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色，包括产品经理 / 架构师 / 项目经理 / 工程师，MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址：https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md