摘要
本发明提出的基于多阶段课程学习的类人机器人跌倒恢复控制方法,通过将机器人跌倒爬起动作分解为多个关键帧,并逐帧分阶段学习,同时引入混合内部模型和强化学习框架,混合内部模型实时获取机器人当前观测值,通过估计速度,获取特征信息,增强策略的鲁棒性,减小了仿真与真实的差距,结合混合内部优化与近端策略优化的强化学期框架,通过与仿真环境交互,使机器人学习快速稳定地从一个关键帧过渡到下一个关键帧,实现复杂人形运动行为的学习,本申请优化了人机交互安全性能,使机器人能够在医疗护理、家庭服务等需要密切人机协作的场景中可靠运行为构建更智能、更安全的下一代服务机器人系统奠定了技术基础。