摘要
本发明公开了一种基于强化学习的蛇形机器人控制方法,包括:搭建包含墙壁、立方体障碍物和低矮通道的复杂地形仿真场景;对蛇形机器人的结构、关节及动力学参数进行建模,得到蛇形机器人仿真模型;定义蛇形机器人的状态空间和动作空间,并设计多元化的奖励函数;采用多层感知器MLP结构构建动作网络和价值网络;应用强化学习算法对蛇形机器人进行多轮仿真训练,使机器人学到不同情景下做出优化决策的参数集,实现蛇形机器人的优化控制,到达目标点。本发明无需依赖视觉信息,能够通过自主学习实现蛇形机器人在复杂环境中高效、稳定运动控制,提升在低矮狭窄空间的穿越能力。