刚刚,加州大学洛杉矶分校(UCLA)副教授周博磊官宣加入机器人初创公司 Coco Robotics,专注于人行道自动驾驶这一难题!
与此同时,Coco Robotics 联合创始人兼 CEO Zach Rash 也宣布了一个好消息,正式成立 Physical AI Lab,周博磊任首席 AI 科学家。
Coco Robotics 成立于 2020 年,是一家专注于「最后一公里」配送的机器人初创公司。早期,公司依赖远程操作员(teleoperators)协助机器人规避配送路径中的障碍。五年过去,伴随技术成熟与数据积累,Coco 接下来想要尝试深入挖掘其机器人车队在真实世界中采集的大量运行数据。
在这一背景下,Coco 推出了全新的 Physical AI Lab,并邀请人工智能领域最具影响力的学者之一、UCLA 副教授周博磊加盟,担任首席 AI 科学家。
Zach Rash 表示,公司一直以来的目标都是实现机器人在「最后一公里」配送中的完全自动驾驶,从而降低整体配送成本。如今,公司已经积累了足够的数据,可以深入推进自动化研发。
更进一步的,Rash 谈到他们已经在最复杂的城市环境中积累了数百万英里的数据,而这些数据对于训练任何有用且可靠的现实世界 AI 系统都极其重要。现在,积累的数据规模已经达到了一个临界点,Rash 认为他们可以真正加速 Physical AI 相关的许多研究进展。
他还表示,邀请周博磊来领导这项工作是一个「毫无疑问的选择」。Rash 指出,周博磊在计算机视觉和机器人领域的研究很大程度上聚焦于小型出行设备(micromobility),而不是传统意义上的大型车辆,这与 Coco 的定位高度契合。
实际上,Coco Robotics 此前就已经与周博磊有合作。Rash 和联合创始人 Brad Squicciarini 都是 UCLA 校友,还曾向学校的研究实验室捐赠过一台 Coco 机器人。
Rash 说:「周博磊是全球在机器人导航、强化学习等多个与我们高度相关的技术和研究领域中最顶尖的研究者之一。我们已经成功招募了一批世界一流的研究人员,都是以往合作过的同事。加入 Coco,帮助公司加速推进各项研发。」
值得一提的是,这家新的研究实验室是独立于 Coco Robotics 与 OpenAI 的合作关系的(此前 Sam Altman 个人为该公司提供了资金支持,但 OpenAI 也从中受益。)。该合作允许 Coco 使用 OpenAI 的模型,同时 OpenAI 的 AI 研究实验室也能访问由 Coco 机器人采集的数据。而 Physical AI Lab 并不是上述合作的一部分,是个独立研究项目。
目前,Coco Robotics 计划将实验室获得的信息和研究成果用于自身发展。公司暂无将这些数据出售给同行的打算。相反这些数据将用于提升公司自身的自动化水平与运行效率,主要应用在其机器人所依赖的本地模型上。Rash 还提到,公司计划在适当情况下向其运营城市分享研究成果,以协助改善道路障碍与基础设施,从而减少机器人在执行任务时的阻碍。
最后,Rash 还表示:这个实验室是否成功,最终体现在他们能否以极低的价格提供高质量的服务。如何进一步降低成本?如何让服务对商家和消费者更加可负担?解决上述问题,将为整个生态系统带来巨大的增长潜力。
周博磊本科毕业于上海交通大学,硕士毕业于香港中文大学(CUHK),并于 2018 年在麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)获得博士学位 。
他的职业生涯包括从 2018 年至 2021 年担任香港中文大学信息工程系助理教授,到目前担任 UCLA 计算机科学系副教授,并同时在计算医学系兼任教职 。
作为 UCLA 周实验室(Zhou Lab)的负责人,他领导着一个由博士后、博士生、硕士生和本科生组成的团队 。
周博磊的研究方向为机器感知和智能决策,重点是通过学习可解释、结构化的表征,使机器能够在复杂的环境中感知、推理和行动。
他在人工智能顶级会议和期刊发表了百余篇学术论文,论文总引用数超过 6 万次,其中一篇一作论文引用接近 14000 次。他在可解释性机器学习和场景理解等课题上有突出成果,主要成果包括 Class Activation Mapping (CAM)、Network Dissection、Places、ADE20K。
可解释性
在深度学习领域,模型的「黑箱」问题 —— 即决策过程不透明,尽管准确率高 —— 是其在自动驾驶等关键领域应用的主要障碍之一。
周博磊的一项核心贡献正是为了解决这一挑战。他提出的类别激活映射(Class Activation Mapping, CAM)技术,作为其被引用次数最多的成果之一,能够有效可视化卷积神经网络在进行图像分类时所关注的具体区域,这项工作对可解释性人工智能领域产生了深远影响。
在 CAM 的基础上,他进一步提出了网络剖析(Network Dissection)的研究,该方法能够自动识别和量化神经网络中单个神经元所代表的语义概念 。这使得研究者不仅能解释单次决策,还能理解整个模型内部知识的表征方式。
场景理解
场景理解领域的发展曾经显著落后于物体识别,其核心瓶颈在于缺乏大规模且多样化的专用数据集。
尽管深度学习因 ImageNet 这类以物体为中心的海量数据库而蓬勃发展,但一个自主智能体若要在世界中导航,不仅需要识别物体,更关键的是要理解其所处的环境和场景,而当时现有的场景数据集在规模上远不足以支撑复杂模型的有效训练。
周博磊领导创建了 Places 数据库,一个包含超过 1000 万张已标注场景照片的庞大资源库。该数据集的问世,使得研究人员能够为场景识别任务训练出强大的深度卷积神经网络,从而大幅提升了模型性能并树立了行业基准。
此外,他还参与构建了用于场景解析的 ADE20K 数据集,通过提供对场景、物体及其部件的像素级标注,赋予了计算机对视觉环境进行更细粒度的理解能力,这对机器人导航等应用至关重要。
参考链接:https://techcrunch.com/2025/10/14/coco-robotics-taps-ucla-professor-to-lead-new-physical-ai-research-lab/
文章来自于“机器中心”,作者“机器之心编辑部”。
【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。
项目地址:https://github.com/browser-use/browser-use
【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。
项目地址:https://github.com/Significant-Gravitas/AutoGPT
【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。
项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md