迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI
8178点击    2025-12-22 16:03

还记得之前非常火的雪宝Olaf机器人吗?


那个走起路来晃晃悠悠、神态活灵活现的小家伙曾让无数人直呼“次元壁破了”。近期,迪士尼幻想工程(Disney Research Imagineering)终于揭开了它的神秘面纱,正式发表了题为“Olaf: Bringing an Animated Character to Life in the Physical World”的技术论文。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


当我们翻开这篇论文,才发现“卖萌”背后的代价是惊人的。原来,为了让这个头大身子小、完全不符合物理规律的动画角色走进现实,工程师们不仅设计了极其怪异的“非对称骨骼”,甚至被迫让AI学会了“怕热”和“轻手轻脚” 。这不是魔法,这是顶级工程学对动画物理的一次硬核挑战。


为什么让“雪宝”来到现实很难


与波士顿动力的Spot或Atlas不同,Olaf的设计初衷不是为了越野或搬运,而是为了娱乐和陪伴,这就带来了特殊的挑战:


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


  • 非物理的动画比例:Olaf有一个巨大的脑袋,却只有极细的脖子和两只小小的“雪球”脚。这种头重脚轻的结构非常不稳定,不符合常规机器人的工程设计原则。
  • 严苛的隐身要求:所有的电机、电池、传感器都必须塞进它那细小的身体里,不能破坏外形。
  • “可信度”不仅是外观:如果机器人走路发出巨大的机械跺脚声,或者动作僵硬,观众瞬间就会“出戏”。必须做到动作流畅且安静。


如何在雪球里藏进一个机器人


要制造Olaf,首先要解决的是“皮囊”之下的骨架问题。


研究者设计出的机器人身高88.7厘米(不含头发),重14.9公斤,全身拥有25个自由度。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


为了还原角色外观,机械设计必须在这个极其紧凑的体积内完成所有功能的布局。


隐形的双腿与非对称设计


在动画中,Olaf的脚是两团在身体下方自由移动的小雪球,看不见腿。


为了在现实中制造这种错觉,研究者必须把腿部机构完全隐藏在下半身的“大雪球”躯干里。


这就带来了一个巨大的空间难题:如果采用传统的对称腿部设计,两个髋关节驱动器会在狭小的空间内打架。


研究者给出了一个非常规的解决方案:非对称的6自由度腿部设计


  • 左腿:髋关节的横滚(Roll)驱动器朝后放置,膝关节向前弯曲。
  • 右腿:髋关节的横滚驱动器朝前放置,膝关节向后弯曲。


这种“一前一后”的交错布局,巧妙地避免了内部机械碰撞,最大化了腿部的活动范围。


同时,由于两条腿的零件其实是相同的(只是安装方向不同),这还减少了零件的种类。


软体裙摆的妙用


为了遮挡这些机械结构,Olaf的下半身并不是坚硬的外壳,而是一条由聚氨酯(PU)泡沫制成的“软裙子”。


这个设计有两层深意:


  • 视觉欺骗:它维持了雪球的形状,但在腿部大幅度运动(比如迈大步保持平衡)时,泡沫可以发生形变,不会卡住腿。
  • 抗摔缓冲:柔软的泡沫还能吸收冲击力。如果Olaf摔倒了,这个软壳能保护内部精密的电机不被摔坏。


远程驱动的手臂与五连杆机构


Olaf的手臂像树枝一样细,肩膀处根本塞不进电机。


但这难不倒研究者。他们采用了连杆机构(Linkages) 来实现“隔空打牛”。


  • 电机被安放在空间相对宽裕的躯干内部。
  • 通过一套球形五连杆机构(Spherical 5-bar linkage),将动力传输到肩膀。


这样一来,手臂依然可以灵活摆动,而驱动它的“肌肉”却藏在了肚子里。


磁吸式的“身体零件”


看过电影的您一定记得,Olaf的身体部件经常散架。


现实中的机器人保留了这个有趣的特性。


手臂、鼻子、扣子、眉毛和头发都是通过磁铁吸附在服装表面的。


这不仅是为了还原角色,更是一种安全机制:


当机器人意外摔倒或发生碰撞时,这些突出的部件会直接脱落,而不是折断或戳伤旁人。


注入灵魂:基于强化学习的运动控制


拥有了身体,还需要一个能驾驭这副奇怪躯体的“大脑”。


Olaf的动作不仅要稳,还要“像”。它需要模仿动画中那种富有弹性、卡通化的行走方式。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


为此,研究者采用了强化学习(Reinforcement Learning, RL) 技术。


双层控制架构


为了处理复杂的全身动作,控制系统被分为了两层:


  • 骨干层(Articulation Backbone):负责腿部、躯干和颈部的核心运动。由强化学习(RL)策略直接控制,主要任务是保持平衡并执行行走指令。
  • 表演层(Show Functions):负责眼睛、眉毛、嘴巴和手臂的细微动作。由于这些部件惯性很小,不会影响身体平衡,因此使用经典的PD控制器即可。


把动画变成数学奖励


AI是通过“奖励”来学习动作的。为了让Olaf走得像个动画角色,研究者设计了一套包含四部分的奖励函数:


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


  • 模仿奖励(Imitation):这是核心。研究者将动画师制作的标准行走动画作为参考数据。AI每一步动作越接近动画里的姿态(关节角度、身体位置),得到的奖励就越高。
  • 正则化(Regularization):鼓励机器人动作平滑,不要出现不必要的颤抖或用力过猛,以此减少磨损和能耗。
  • 限制约束(Limits):惩罚超出关节活动范围或违反物理限制的行为。
  • 冲击减少(Impact Reduction):这是一个专门为了解决噪音问题而设计的关键项(后文详述)。


通过在仿真环境(Isaac Sim)中通过数千次的迭代训练,Olaf学会了如何在物理法则的限制下,走出标志性的卡通步伐。


静音行走:如何让机器人不“跺脚”


任何在现场听过双足机器人走路的人都知道,那声音通常是“哐、哐、哐”的金属撞击声。


对于一个由雪做的角色来说,这种机械噪音会瞬间破坏“可信度”,让观众意识到面前只是一堆伺服电机。


为了解决这个问题,研究者在强化学习中引入了一项特殊的“冲击减少奖励”。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


罚速度突变


原理并不复杂,但非常有效。


在物理引擎中,脚步落地的瞬间通常伴随着垂直速度的剧烈变化。


研究者在奖励函数中加入了一项惩罚:如果脚落地时的速度变化率过大,AI就会被扣分


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


灰色线(无降噪策略):在落地瞬间(约 0.45秒处),速度曲线有一个尖锐的突变(Spike)。这就是“哐”的一声来源。紫色线(有降噪策略):曲线变得更加平滑,没有剧烈的速度跳变。这意味着脚是轻柔地“放”在地上的,而不是“砸”在地上的。


听得见的效果


这项改进迫使AI学会了一种更轻柔的着地策略——在脚触地前的一瞬间微妙地减速缓冲。


实验数据表明,这项奖励机制将Olaf行走时的平均噪音降低了13.5分贝(dB)


在对比视频中,未开启该功能的机器人走路像是在砸地,而开启后的Olaf步态更加轻盈流畅,更符合角色的设定。


热感知大脑:解决大头细脖子的散热危机


Olaf的设计不仅考验机械结构,更考验热管理。


雪宝巨大的头部,完全依靠藏在细脖子里的微型电机来驱动。


这意味着,为了支撑头部的重量,颈部电机即使在静止时也需要输出巨大的扭矩,导致极易过热。


早期实验显示,如果不加干预,颈部电机在短短40秒内温度就能飙升到100°C,导致强制停机。研究者不能给Olaf装上巨大的散热风扇(那会破坏外观),于是他们让AI学会了“怕热”。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


Top (温度): 蓝色线(无保护):温度一路飙升,40秒就冲破100度,导致实验必须强制停止。


紫色线(有保护):温度上升缓慢,始终被控制在80度的安全线以下。


Middle (误差):紫色线的误差(Joint error)在后期略微升高。这说明 AI 为了降温,主动“偷懒”了,稍微牺牲了一点动作准确度。


Bottom (扭矩):紫色线的扭矩(Torque)在大约40秒后显著下降。这是因为 AI 调整了头部姿势,减少了受力,从而让电机冷却下来。


将温度入感知


研究者开发了一个热感知策略(Thermal-aware policy)


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


热模型与奖励参数


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


控制障碍函数(CBF)


为了确保安全,研究者使用了一种称为控制障碍函数(Control Barrier Function) 的数学工具。


您可以把它想象成一道“软墙”:


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


聪明的妥协


实验结果非常有趣。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


对比了预测温度(紫色虚线)和真实温度(绿色实线)。两条线几乎完美重合。这意味着,研究者在仿真软件里就能极其精确地预知现实中电机何时会过热(平均误差仅 1.87度)。这是热感知策略能成功的基础


当开启热感知策略后,随着颈部电机温度升高,Olaf并没有直接死机。


相反,它会自动调整姿态,比如稍微放平头部角度,或者减少高频的头部摆动,以此来降低维持姿态所需的扭矩。


虽然这导致动作追踪的精确度有轻微下降(误差略微增加),但成功将温度控制在了安全范围内,让机器人可以持续运行。


这就好比人累了会偷懒一样,Olaf学会了在“演得像”和“活下去”之间寻找平衡。


表演细节:眼睛、嘴巴与人偶操控


除了走路和平衡,Olaf的神韵还来自于它的面部表情。


这部分功能虽然不涉及复杂的平衡算法,但也充满了工程巧思。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


眼睛的机械结构


Olaf的眼部机构拥有独立的偏航(Yaw)控制,同时通过连杆实现了眼球俯仰(Pitch)和眼睑闭合的联动。


为了让控制更精准,研究者首先在功能空间(动画师理解的“向左看”)和驱动器空间(电机转多少度)之间建立了映射关系。


这使得后台的动画引擎可以直接发送高级指令,而底层的PD控制器负责精准执行。


嘴巴的“前馈”补偿


Olaf的嘴巴开合不仅要克服重力,还要克服服装面料的拉力。


当嘴巴闭合时,布料被拉紧;张开时,布料会起皱。这些外力是非线性的,会导致普通的电机控制不准。


为此,研究者测量了在不同张嘴角度下所需的保持力矩,并拟合了一个前馈模型(Feedforward term)


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


这个模型会告诉控制器:“在这个角度,布料的拉力大概是这么多,你需要额外多出一点力。”


实时人偶操控(Puppeteering)


最终,所有这些技术都汇聚到了运行时的操控系统中。


迪士尼真的造出了「雪宝」Olaf!但为了不让它“融化”,工程师逼疯了AI


通过一个定制的动画引擎,操作员可以用摇杆实时控制Olaf:


  • 空闲状态:机器人会自动播放背景动画(如眼球的微颤、手臂的调整),保持“活”的感觉。
  • 触发动作:操作员可以一键触发特定的表演片段(如打招呼、说话)。
  • 行走接管:操作员控制行进方向,而底层的强化学习策略负责处理具体的迈步和平衡。


超越功能的艺术工程


迪士尼这篇论文展示了一个非典型的机器人研发案例。


研究者并没有试图让机器人跑得更快或跳得更高,而是通过非对称的机械结构基于感知的热管理策略以及静音行走的奖励机制,攻克了“让动画角色进入物理世界”这一难题。


Olaf机器人证明了,在严格的美学限制和糟糕的物理比例下,现代机器人技术依然可以创造出令人信服的生命幻象。


正如论文最后所提到的,这是第一款此类机器人,它为未来非人型、非工业用途的“角色机器人”设立了新的标杆。


也许在不久的将来,当我们走进主题乐园,身边走过的不再是穿着皮套的工作人员,而是这些真正从屏幕里走出来的、有温度(虽然需要控制在80°C以下)的“机械生命”。


文章来自于“AI修猫Prompt”,作者 “AI修猫Prompt”。

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
AI工作流

【开源免费】字节工作流产品扣子两大核心业务:Coze Studio(扣子开发平台)和 Coze Loop(扣子罗盘)全面开源,而且采用的是 Apache 2.0 许可证,支持商用!

项目地址:https://github.com/coze-dev/coze-studio


【开源免费】n8n是一个可以自定义工作流的AI项目,它提供了200个工作节点来帮助用户实现工作流的编排。

项目地址:https://github.com/n8n-io/n8n

在线使用:https://n8n.io/(付费


【开源免费】DB-GPT是一个AI原生数据应用开发框架,它提供开发多模型管理(SMMF)、Text2SQL效果优化、RAG框架以及优化、Multi-Agents框架协作、AWEL(智能体工作流编排)等多种技术能力,让围绕数据库构建大模型应用更简单、更方便。

项目地址:https://github.com/eosphoros-ai/DB-GPT?tab=readme-ov-file



【开源免费】VectorVein是一个不需要任何编程基础,任何人都能用的AI工作流编辑工具。你可以将复杂的工作分解成多个步骤,并通过VectorVein固定并让AI依次完成。VectorVein是字节coze的平替产品。

项目地址:https://github.com/AndersonBY/vector-vein?tab=readme-ov-file

在线使用:https://vectorvein.ai/付费

2
prompt

【开源免费】LangGPT 是一个通过结构化和模板化的方法,编写高质量的AI提示词的开源项目。它可以让任何非专业的用户轻松创建高水平的提示词,进而高质量的帮助用户通过AI解决问题。

项目地址:https://github.com/langgptai/LangGPT/blob/main/README_zh.md

在线使用:https://kimi.moonshot.cn/kimiplus/conpg00t7lagbbsfqkq0