领先硅谷巨头押注人类数据，融资数亿的深度机智全速冲向具身AGI

8671点击 2026-05-16 13:45

「人间一年，预言实现。」

2025年3月，北京中关村一间会议室里，气氛凝重。深度机智创始人陈凯刚结束一场路演。对面坐着某头部基金合伙人，当他听完陈凯关于“只有用人类第一视角训练、才能通往具身智能AGI”的判断后，说了句：“这个方向美国人没走通，你为什么要走？”

走出会议室，同行的深度机智早期成员忍不住直言：“以后见投资人，不要再讲智能眼镜，不要再讲第一视角，投资人不认可，你讲这些有什么用？”

起步即暗黑时刻。融资屡屡碰壁，人才引进举步维艰，初始团队对路线动摇到只剩两个人，陈凯坚持的那套模型理论在当时的创投圈“太新潮”——主流共识仍是遥操作设备、真机和仿真数据，即便今天依然如此。

但转圜很快发生。2025年5月Tesla宣布Optimus机器人的训练转向人类视频数据；6月GeneralistAI就发布demo展示机器人的拟人学习能力，五个月后以27万小时真实人类采集数据初步验证规模定律，在此前后，FigureAI也宣布与商业地产公司合作采集人类第一视角数据；2026年2月，英伟达发布的EgoScale也是通过2 万小时第一人称视角视频数据做预训练，让机器人学习灵巧操作。

此时人们猛然发现：这家中国公司提前一年押注的路线，与硅谷最炙手可热的几家巨头，形成了零时差共振。资本也纷至沓来。

「暗涌Waves」独家获悉，深度机智成立一周年完成多轮融资，累计融资总额数亿元。资方包括中关村资本、普华资本、东方富海、蓝湖资本、晶科能源控股旗下CVC基金、诚通科创基金、云岫资本、未来光锥前沿科技基金、北京熙诚致远等，同时获得中科大校友基金支持。

命运的反转本质上是行业认知的撕裂，这条外部意外验证的时间线，更像一场被延迟确认的“预言自我实现”。深度机智从成立第一天起就定下“具身AGI”的终极目标，主攻中国自主机器人大脑，走的是“人类学习”技术路线，通过提取并增强模型的物理常识，推动具身模型走向更强的通用性。

5月15日，深度机智一周年，技术成果接连收获权威认可，其Z-WM_v1机器人世界模型以64.96的综合评分，超越当前榜首（64.24分），实现世界模型能力的综合领先，而仅一周前，其STARRY模型刚刚在VLA领域权威基准RoboTwin 2.0中斩获亮眼成绩。

Part01

数据的“暴力证明”

要理解深度机智，必须先切回到那个“两秒画面”。

2024年底，Meta发布新款AI眼镜，宣传视频里有一个仅持续两秒的镜头——眼镜被戴到了机器人身上。曾经担任微软亚洲研究院首席研究员的陈凯，当即意识到：使用人类第一视角数据做具身智能的研究员，不止他一个。

这个判断的逻辑朴素到近乎直白：数字世界的AGI是通过学习人类在数字世界的行为实现的，那么物理世界的AGI，自然应该学习人类在物理世界的行为。而人类第一视角数据，恰好完整记录了“人看到了什么、听到了什么、怎么和世界交互”。

“我们最终要构建的是一个硅基的人。它用眼睛看、用耳朵听、用身体感知世界——那最好的养料，就是人的第一视角数据。”陈凯说。

目前行业比拼的、真正的“杀手级验证”，其实并非数据时长和数量，而是数据效率和模型的泛化性。

深度机智大模型的底层架构并未沿用主流的VLA或PaLM-E路径，而是完全自研，围绕“物理理解”深度重构。2026年3月发布的PhysBrain 1.0仅使用3000小时开源人类数据、在没有任何动作预训练的前提下，以极高的数据效率在多个具身任务的国际榜单中表现突出：SimplerEnv WidowX Robot测试中80.2%的平均成功率，赶超国际标杆π0.523.1个百分点，在RoboCasa与LIBERO任务中，PhysBrain同样稳居榜首。

在这些核心维度上，形成对依赖海量动作数据训练的众多知名模型的明确性能优势。千小时人类数据超越数万小时真机数据的结果在挑战行业默认假设：更多数据必然带来更好智能。深度机智至少证明了，数据的质量（是否蕴含物理常识）比数量更重要。

陈凯告诉我，支撑这一效率的是关于数据、模型架构、训练方法的三项底层创新，核心思路是“先理解物理、后执行动作”。

如果简单区分，目前具身智能领域的创业者大概为两类：一类是“机器人+AI”思维——面向特定问题求解，用AI解决机器人任务的泛化；另一类是“AGI物理延伸”思维——用大模型方法论构建理解物理世界的基座。

相比市面多数公司，深度机智的特质在于其并未将数据、模型底座和本体割裂，而是选择同步自研、形成全栈闭环。而深度机智提出并定义的“人类学习”路线，本质上不是一个数据路线，而是一套围绕机器人大脑构建的系统工程。

在模型层，PhysBrain 1.0尝试定义具身智能的全新基座；在硬件层，推出全尺寸工业级拟人体机器人Prime，为模型提供真实的执行和验证载体；在数据层，通过自研便携式采集设备，采用无需在手部佩戴机械装备的轻量化第一视角方案，在真实工作情境中完成多模态数据采集。

这种路径其实更接近于具身智能时代的“基础设施公司”，构建了全球首个“人类学习”范式的具身通用智能模型。

Part02

唯一目标：

具身AGI的全球竞速

创业一年，陈凯的想法从未动摇：通过“人类学习”的路径实现具身AGI。涉足数据采集和本体硬件，原因只有一个：他们走的那条路，在出发时几乎无人同行，市场上甚至不存在符合需求的训练数据，“我们不得已走上了全栈。”但结果是，深度机智比大多数同行更早完成了从数据到模型到本体的系统布局。

Prime正是在这个背景下出现的。作为深度机智推出的全尺寸拟人体机器人，Prime 的意义并不是宣告公司转向整机路线，而是为“人类学习”路线提供一个更适合承接人类经验迁移的具身载体。

Prime其实早在2025年9月就已经研制完成，身高173cm，全身结构与人类相似，可以直接把人的动作给映射过去。深度机智在全尺寸拟人体机器人本体Prime上，完成了毫米级精度的拟人操作闭环，陆续在实验、厨房、娱乐、工厂和生活等场景中，展示出多类拟人操作能力。

领先硅谷巨头押注人类数据，融资数亿的深度机智全速冲向具身AGI

图片说明：深度机智对外展示动态图

对深度机智来说，实现精细操作是一整套系统能力的结果。陈凯认为这是一个阶段性验证：用人类第一视角数据理解真实世界，用拟人体本体缩小人与机器人之间的动作映射差异，再通过高精度控制系统承载真实任务中的精细执行。

但还远远不够。目前深度机智正在探索Prime的两个方向：一是作为科研平台验证算法；二是探索商业化可能。陈凯提到“脏、难、繁、险、奇”的场景方向，“机器人真正要解决的，是那些对人来说危险、繁琐、招不到人的场景。”据了解团队已在康养等场景开展数据采集和初步落地的探索。在这些场景中，对“理解世界”的要求远高于“执行动作”，也更能体现模型层能力的差异。

与此同时，深度机智推出了轻量化教育版Prime Lite，并与北京十一学校等机构合作建立了具身智能教育实验室。这是在为未来的开发者生态做准备。

他毫不介意被对标为“中国版的Generalist AI”，甚至进一步强调：我们不只是跟随，而是要在具身基础架构层展开正面竞争。这种定位，意味着公司选择站在产业链中上游——不做具体产品，而是为整个机器人行业提供智能底座和服务。

陈凯告诉我，深度机智的当前商业化路径必须基于“为实现AGI而衍生出的中间技术”，而核心研发团队的唯一使命就是追求极致的智能跃升”。他对时间线的判断也相对乐观：2-3年技术将迎来巨大突破，3-5年商业化也有望取得大的成功。

Part03

非典型少年天才团队

事实上，深度机智最先获取的认可，反而来自国家队。

深度机智起初由北京中关村学院和中关村人工智能研究院联合孵化，又在2025年12月入选了北京市科委的高端领军人才聚集培养工程。评审专家告诉陈凯：他们10月份去美国考察时发现，使用第一视角数据已成为国外共识，但“环顾中国，没有看到这样做的团队”。直到2026年初资本才喷涌而入。

公司最艰难的时候，因为投资人和团队对技术路线的不认同，一度只剩陈凯和联合创始人张翼博两个人坚守。

陈凯在人工智能领域深耕15年，历任微软亚洲研究院首席研究员、北京智源人工智能研究院研究员。张翼博与陈凯为中科大少年班学院室友，拥有十五年应用物理学背景，博士师从美国UCLA科学智能泰斗、微生物科学院院士。

陈凯形容自己和张翼博并非典型的年少成名、少年天才，一路走下来经历了不少挫折，直到找到了具身AGI，才有了“灵魂被击中的感觉。”

而后来何旭国的加入补上了从虚拟算法到真实本体的最后一环。何旭国是“机器人奥运会”First Global Challenge青少年国家队的总教练，在机器人领域全栈深耕十余年，也是Prime和Prime lite的总设计师。

由此，一个覆盖认知建模-科学理解-工程实现的铁三角成型。陈凯负责AI底座，张翼博注入物理思维，何旭国落地硬件闭环。

这种结构在具身智能领域相对稀缺——多数团队要么偏算法、要么偏硬件，能够同时覆盖大脑与身体的并不多见。

“我们三个最大的共性是韧性都非常强，从来没有过激烈争吵。”这在创始人团队分崩出走、自立门户成为常态的机器人行业，甚至显得有几分反常。他和张翼博2007年相识，与何旭国认识近五年，关系深厚，互相坦诚，彼此默契。他们还提前讨论过未来会不会因为认知差别导致公司无法持续，最后得出的结论是不会，因为“核心目标就是实现具身AGI，其他的不在考虑范围内。”目标一致，边界清晰，这本身就是答案。

在具身智能这个超级赛道里，深度机智选择了一个足够难、上限也足够高的位置。跋涉一年，先行者不再孤独。

文章来自于微信公众号 “暗涌Waves”，作者 “暗涌Waves”

关键词: AI新闻 , 深度机智 , 具身智能 , Z-WM_v1