领先硅谷巨头押注人类数据,融资数亿的深度机智全速冲向具身AGI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
领先硅谷巨头押注人类数据,融资数亿的深度机智全速冲向具身AGI
7779点击    2026-05-16 13:45

人间一年,预言实现。


2025年3月,北京中关村一间会议室里,气氛凝重。深度机智创始人陈凯刚结束一场路演。对面坐着某头部基金合伙人,当他听完陈凯关于“只有用人类第一视角训练、才能通往具身智能AGI”的判断后,说了句:“这个方向美国人没走通,你为什么要走?”


走出会议室,同行的深度机智早期成员忍不住直言:“以后见投资人,不要再讲智能眼镜,不要再讲第一视角,投资人不认可,你讲这些有什么用?”


起步即暗黑时刻。融资屡屡碰壁,人才引进举步维艰,初始团队对路线动摇到只剩两个人,陈凯坚持的那套模型理论在当时的创投圈“太新潮”——主流共识仍是遥操作设备、真机和仿真数据,即便今天依然如此。


但转圜很快发生。2025年5月Tesla宣布Optimus机器人的训练转向人类视频数据;6月GeneralistAI就发布demo展示机器人的拟人学习能力,五个月后以27万小时真实人类采集数据初步验证规模定律,在此前后,FigureAI也宣布与商业地产公司合作采集人类第一视角数据;2026年2月,英伟达发布的EgoScale也是通过2 万小时第一人称视角视频数据做预训练,让机器人学习灵巧操作。


此时人们猛然发现:这家中国公司提前一年押注的路线,与硅谷最炙手可热的几家巨头,形成了零时差共振。资本也纷至沓来。


「暗涌Waves」独家获悉,深度机智成立一周年完成多轮融资,累计融资总额数亿元。资方包括中关村资本、普华资本、东方富海、蓝湖资本、晶科能源控股旗下CVC基金、诚通科创基金、云岫资本、未来光锥前沿科技基金、北京熙诚致远等,同时获得中科大校友基金支持。


命运的反转本质上是行业认知的撕裂,这条外部意外验证的时间线,更像一场被延迟确认的“预言自我实现”。深度机智从成立第一天起就定下“具身AGI”的终极目标,主攻中国自主机器人大脑,走的是“人类学习”技术路线,通过提取并增强模型的物理常识,推动具身模型走向更强的通用性。


5月15日,深度机智一周年,技术成果接连收获权威认可,其Z-WM_v1机器人世界模型以64.96的综合评分,超越当前榜首(64.24分),实现世界模型能力的综合领先,而仅一周前,其STARRY模型刚刚在VLA领域权威基准RoboTwin 2.0中斩获亮眼成绩。


Part01


数据的“暴力证明”


要理解深度机智,必须先切回到那个“两秒画面”。


2024年底,Meta发布新款AI眼镜,宣传视频里有一个仅持续两秒的镜头——眼镜被戴到了机器人身上。曾经担任微软亚洲研究院首席研究员的陈凯,当即意识到:使用人类第一视角数据做具身智能的研究员,不止他一个。


这个判断的逻辑朴素到近乎直白:数字世界的AGI是通过学习人类在数字世界的行为实现的,那么物理世界的AGI,自然应该学习人类在物理世界的行为。而人类第一视角数据,恰好完整记录了“人看到了什么、听到了什么、怎么和世界交互”。


“我们最终要构建的是一个硅基的人。它用眼睛看、用耳朵听、用身体感知世界——那最好的养料,就是人的第一视角数据。”陈凯说。


目前行业比拼的、真正的“杀手级验证”,其实并非数据时长和数量,而是数据效率和模型的泛化性。


深度机智大模型的底层架构并未沿用主流的VLA或PaLM-E路径,而是完全自研,围绕“物理理解”深度重构。2026年3月发布的PhysBrain 1.0仅使用3000小时开源人类数据、在没有任何动作预训练的前提下,以极高的数据效率在多个具身任务的国际榜单中表现突出:SimplerEnv WidowX Robot测试中80.2%的平均成功率,赶超国际标杆π0.523.1个百分点,在RoboCasa与LIBERO任务中,PhysBrain同样稳居榜首。


在这些核心维度上,形成对依赖海量动作数据训练的众多知名模型的明确性能优势。千小时人类数据超越数万小时真机数据的结果在挑战行业默认假设:更多数据必然带来更好智能。深度机智至少证明了,数据的质量(是否蕴含物理常识)比数量更重要。


陈凯告诉我,支撑这一效率的是关于数据、模型架构、训练方法的三项底层创新,核心思路是“先理解物理、后执行动作”。


如果简单区分,目前具身智能领域的创业者大概为两类:一类是机器人+AI”思维——面向特定问题求解,用AI解决机器人任务的泛化;另一类是“AGI物理延伸思维——用大模型方法论构建理解物理世界的基座。


相比市面多数公司,深度机智的特质在于其并未将数据、模型底座和本体割裂,而是选择同步自研、形成全栈闭环。而深度机智提出并定义的“人类学习”路线,本质上不是一个数据路线,而是一套围绕机器人大脑构建的系统工程。


在模型层,PhysBrain 1.0尝试定义具身智能的全新基座;在硬件层,推出全尺寸工业级拟人体机器人Prime,为模型提供真实的执行和验证载体;在数据层,通过自研便携式采集设备,采用无需在手部佩戴机械装备的轻量化第一视角方案,在真实工作情境中完成多模态数据采集。


这种路径其实更接近于具身智能时代的“基础设施公司”,构建了全球首个“人类学习”范式的具身通用智能模型。


Part02


唯一目标:


具身AGI的全球竞速


创业一年,陈凯的想法从未动摇:通过“人类学习”的路径实现具身AGI。涉足数据采集和本体硬件,原因只有一个:他们走的那条路,在出发时几乎无人同行,市场上甚至不存在符合需求的训练数据,“我们不得已走上了全栈。”但结果是,深度机智比大多数同行更早完成了从数据到模型到本体的系统布局。


Prime正是在这个背景下出现的。作为深度机智推出的全尺寸拟人体机器人,Prime 的意义并不是宣告公司转向整机路线,而是为“人类学习”路线提供一个更适合承接人类经验迁移的具身载体。


Prime其实早在2025年9月就已经研制完成,身高173cm,全身结构与人类相似,可以直接把人的动作给映射过去。深度机智在全尺寸拟人体机器人本体Prime上,完成了毫米级精度的拟人操作闭环,陆续在实验、厨房、娱乐、工厂和生活等场景中,展示出多类拟人操作能力。


领先硅谷巨头押注人类数据,融资数亿的深度机智全速冲向具身AGI


图片说明:深度机智对外展示动态图


对深度机智来说,实现精细操作是一整套系统能力的结果。陈凯认为这是一个阶段性验证:用人类第一视角数据理解真实世界,用拟人体本体缩小人与机器人之间的动作映射差异,再通过高精度控制系统承载真实任务中的精细执行。


但还远远不够。目前深度机智正在探索Prime的两个方向:一是作为科研平台验证算法;二是探索商业化可能。陈凯提到“脏、难、繁、险、奇”的场景方向,“机器人真正要解决的,是那些对人来说危险、繁琐、招不到人的场景。”据了解团队已在康养等场景开展数据采集和初步落地的探索。在这些场景中,对“理解世界”的要求远高于“执行动作”,也更能体现模型层能力的差异。


与此同时,深度机智推出了轻量化教育版Prime Lite,并与北京十一学校等机构合作建立了具身智能教育实验室。这是在为未来的开发者生态做准备。


他毫不介意被对标为中国版的Generalist AI”,甚至进一步强调:我们不只是跟随,而是要在具身基础架构层展开正面竞争。这种定位,意味着公司选择站在产业链中上游——不做具体产品,而是为整个机器人行业提供智能底座和服务。


陈凯告诉我,深度机智的当前商业化路径必须基于“为实现AGI而衍生出的中间技术”,而核心研发团队的唯一使命就是追求极致的智能跃升”。他对时间线的判断也相对乐观:2-3年技术将迎来巨大突破,3-5年商业化也有望取得大的成功。


Part03


非典型少年天才团队


事实上,深度机智最先获取的认可,反而来自国家队。


深度机智起初由北京中关村学院和中关村人工智能研究院联合孵化,又在2025年12月入选了北京市科委的高端领军人才聚集培养工程。评审专家告诉陈凯:他们10月份去美国考察时发现,使用第一视角数据已成为国外共识,但“环顾中国,没有看到这样做的团队”。直到2026年初资本才喷涌而入。


公司最艰难的时候,因为投资人和团队对技术路线的不认同,一度只剩陈凯和联合创始人张翼博两个人坚守。


陈凯在人工智能领域深耕15年,历任微软亚洲研究院首席研究员、北京智源人工智能研究院研究员。张翼博与陈凯为中科大少年班学院室友,拥有十五年应用物理学背景,博士师从美国UCLA科学智能泰斗、微生物科学院院士。


陈凯形容自己和张翼博并非典型的年少成名、少年天才,一路走下来经历了不少挫折,直到找到了具身AGI,才有了“灵魂被击中的感觉。”


而后来何旭国的加入补上了从虚拟算法到真实本体的最后一环。何旭国是“机器人奥运会”First Global Challenge青少年国家队的总教练,在机器人领域全栈深耕十余年,也是Prime和Prime  lite的总设计师。


由此,一个覆盖认知建模-科学理解-工程实现的铁三角成型。陈凯负责AI底座,张翼博注入物理思维,何旭国落地硬件闭环。


这种结构在具身智能领域相对稀缺——多数团队要么偏算法、要么偏硬件,能够同时覆盖大脑与身体的并不多见。


“我们三个最大的共性是韧性都非常强,从来没有过激烈争吵。”这在创始人团队分崩出走、自立门户成为常态的机器人行业,甚至显得有几分反常。他和张翼博2007年相识,与何旭国认识近五年,关系深厚,互相坦诚,彼此默契。他们还提前讨论过未来会不会因为认知差别导致公司无法持续,最后得出的结论是不会,因为“核心目标就是实现具身AGI,其他的不在考虑范围内。”目标一致,边界清晰,这本身就是答案。


在具身智能这个超级赛道里,深度机智选择了一个足够难、上限也足够高的位置。跋涉一年,先行者不再孤独。


文章来自于微信公众号 “暗涌Waves”,作者 “暗涌Waves”

AITNT-国内领先的一站式人工智能新闻资讯网站