摘要
本发明涉及一种虚实融合驱动的人形机器人行走训练方法,包括:S1、搭建机器人行走训练场景,采集机器人行走时的数据;S2、根据物理世界中传感器采集的数据构建包含机器人关节状态和目标位置的数据空间;S3、根据物理空间的数据构建初步观测空间,结合仿真空间的传感器数据,构造虚实融合后的观测空间;S4、基于虚实融合后的观测空间,构建奖励函数,修正机器人行走策略;S5、将修正后的机器人行走策略部署在真实机器人进行真实地面行走适应,并反馈信息给仿真空间进行控制策略优化。与现有技术相比,本发明通过物理数据反馈给仿真环境观测空间调整策略的方式,提高了人形机器人行走的稳定性和安全性。