ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长
6093点击    2026-04-17 10:25

具身智能领域论文被引次数最高的华人学者,带着十七年海外积淀,回来了。


刚刚,在第五届中国三维视觉大会(China3DV 2026)上,李飞飞弟子、ImageNet作者苏昊正式被复旦官宣加盟。


加盟复旦后,苏昊将担任浩清特聘教授,领衔建设通用物理智能研究院并出任院长


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长

△图源:复旦大学官方公众号


对于苏昊的回归,复旦大学官方将其定义为复旦“面向智能时代的关键落子”。


实际上,早在官宣之前,UCSD和复旦校内已有传言流出,称具身智能领域的领跑者苏昊即将赴复旦任教。


如今靴子落地,坐实了这一场备受期待的回国。


谁是苏昊?


苏昊,具身智能领域论文被引次数最高的华人学者,ImageNet缔造者之一,ShapeNet、PointNet、PartNet、SAPIEN、ManiSkill等一众奠基级项目的主导者,具身智能公司Hillbot联合创始人兼CTO。


在此之前,他是加州大学圣地亚哥分校(UCSD)计算机科学与工程系副教授,同时还是具身智能实验室主任。


早前,苏昊在UCSD的个人主页已经停止维护、不再更新。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


在苏昊新的个人主页上,已经更新了在复旦的最新任职。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


截至目前,其谷歌学术被引次数超过14.5万次,在具身AI领域的华人学者中排名第一。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


去年,他还与谢赛宁共同获得了CVPR青年学者奖,理由是表彰他们在计算机视觉领域的杰出贡献。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


值得一提的是,苏昊还是弋力(清华叉院助理教授)、卢策吾(穹彻智能创始人、上交教授)、王鹤(银河通用创始人、北大助理教授)、严梦媛(OpenAI研究员)、莫凯淳(英伟达研究员)等一众知名学者的师兄。


从北航到普林斯顿,再到斯坦福


2002年,苏昊进入北京航空航天大学攻读计算机科学本科,是北航高等理工学院的第一届学员。


本科期间,他师从中科院院士、前北航校长李未教授,研究数理逻辑与定理自动证明。


2005年,经李未教授推荐,他前往微软亚洲研究院(MSRA)实习,师从孙剑、沈向洋、周明。


彼时他主攻自然语言处理,但随着研究深入,他逐渐意识到,相较于抽象的语言,直接来自物理世界的信号(如视觉)才是理解智能更根本的途径


苏昊的研究重心,也由此转向计算机视觉。


2008年,在沈向洋的推荐下,苏昊先后在普林斯顿和斯坦福参与了ImageNet项目,并在2009年跟随李飞飞正式转入斯坦福


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


ImageNet这一奠基性数据集,后来推动了近二十年的人工智能浪潮。


在ImageNet之后,苏昊与李佳合作了Object Bank,进一步提升了图像在高层视觉任务中的语义表示能力,使得简单分类器也能在物体识别和场景分类等任务上取得优异性能,这篇研究发表于2010年的NIPS上。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


3D视觉的奠基人


当2D视觉的方法论日趋完善后,苏昊将目光转向3D视觉。


2014年,在获得北航数学博士学位后的他,在Leonidas Guibas指导下于斯坦福攻读计算机博士,主攻三维感知。


2015年,他发布ShapeNet——全球第一个大规模3D数据集,包含逾300万个3D CAD模型,涵盖3135个类别,被外界誉为“3D领域的ImageNet”。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


ShapeNet发布后,3D视觉研究随即进入黄金发展期。


2017年,PointNet与PointNet++相继发布,让3D视觉相关论文在顶会的占比从不足10%跃升至70%。


其中PointNet是首个直接处理原始点云数据的深度学习模型,而PointNet++则进一步捕捉点云中的局部结构信息。


这两项工作,如今已广泛应用于自动驾驶系统。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


2018年获得斯坦福计算机博士后,苏昊又发布了3D物体数据集PartNet,并入职加州大学圣地亚哥分校。


从视觉到具身


感知之后,苏昊的下一个问题是,能不能把具体的感知算法整合进一个更大的系统


这一思考,驱动他从计算机视觉迁移到机器人研究。


2020年,他基于PartNet发布了全球第一个以可泛化操作为核心的模拟器——SAPIEN(命名灵感来自《人类简史》中的“智人”),为机器人视觉与交互任务的研究搭建了关键基础设施。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


2021年,他又在此基础上推出ManiSkill机器人操作仿真平台,用于测试和训练机器人操作技能。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


同年ICCV,苏昊发起workshop,聚焦基于物理的建模与仿真、基于学习的仿真、人体仿真到具身视觉和机器人学习等广泛主题。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


这些成果,也延续到了苏昊创办的具身智能公司Hillbot上。


2024年,苏昊加入了具身智能的创业浪潮,创办了Hillbot,并担任首席技术官。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


Hillbot旗下拥有的两张王牌,正是苏昊此前发布的SAPIEN仿真器及ManiSkill训练平台,主打模拟与3D生成。


另外,Hillbot已与英伟达合作,借助Nvidia Cosmos平台生成高仿真视频训练数据。


产品方面,Hillbot推出了轮式机器人Hillbot Alpha,基于仿真训练,主要用于复杂环境下的移动操纵任务,如零售店、咖啡馆和制造车间等。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长


为什么选择复旦?


对于加盟复旦这个选择,苏昊给出了简洁而坚定的解释:


因为复旦要做的事,与我要做的事,是同一件事。


那件事,指的便是推动“物理智能”的最终实现


所谓物理智能,是让AI系统在物理世界中有效完成任务——既能理解这个世界,也能执行恰当的行动。


在苏昊看来,这不仅是算法问题,更涉及机器人实体、多学科交融,以及一个完善的产业生态。


他看中复旦的理由具体而落地,复旦拥有深厚的数学、物理学科根基,积极推进的新工科建设,以及地处上海和长三角中心的产业与区位优势。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长

△图源:复旦大学官方公众号


以此为目标,加盟复旦后,苏昊将领衔建设通用物理智能研究院


该学院依托复旦大学智能机器人与先进制造创新学院,打破传统院系划分,不设学科边界,完全围绕问题导向,汇聚数学、物理、计算机、人机交互、脑机接口等多领域顶尖人才。


他直言,研究院的目标是培养未来5到10年的人工智能领军人物


在人才培养理念上,他强调两点——高品位的科研眼光(知道什么问题值得做)和长周期的探索耐心(愿意把问题做完)。


论文不是目标,而是副产品。真正的标尺,是能否在真实世界中实现智能体的有效行动与自主决策。


研究院将重构课程体系,缩短从基础到前沿的路径,让学生尽早进入科研与实践,同时大力支持师生创新创业,推动成果转化。


具身智能:乐观,但谨慎


对于当下火热的具身智能赛道,苏昊的判断是“谨慎的乐观”。


乐观的底气来自问题本身,因为这是一个既有科学深度、又有巨大产业潜力的真问题


谨慎则来自于现实,因为当前涌现出的大量精彩演示,与真正的通用能力之间,仍存在关键断层。


而填补这一断层的核心,正是物理智能。


ImageNet作者苏昊回国任教复旦!李飞飞高徒,具身第一高引,出任通用物理AI院长

△图源:复旦大学官方公众号


谈到“具身智能的ChatGPT时刻”,苏昊坦言,短期内实现大语言模型那种程度的泛化还不现实,但在更长时间尺度上,方向是清晰的。


他预见,具身智能将深度渗透制造业、服务业、养老行业等领域,最终推动人类走向“人机正面互动、人机共存的时代”。


而通往那一未来的桥梁,正建立在今天对物理智能的扎实探索之上。


苏昊从中国出发,一路从2D到3D,从视觉到具身,一步步打通“让机器理解世界”的关键路径。


如今,他带着这一切回来了——落脚复旦,直面物理智能这道真正的难题。


世界级AI科学家的加盟,也把复旦在AI和具身智能,推向了世界最前沿。


参考链接:

[1]https://mp.weixin.qq.com/s/sv768xtTCHv6Uy9qbD92EA

[2]https://www.haosu.ai/


文章来自于"量子位",作者 "克雷西"。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


2
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md