一种基于深度强化学习的水下机器人编队的路径规划方法
申请号:CN202410947753
申请日期:2024-07-16
公开号:CN118760220A
公开日期:2024-10-11
类型:发明专利
摘要
本发明的一种基于深度强化学习的水下机器人编队的路径规划方法,包括:对海洋环境进行三维建模,进行初始化设置;在跟随者‑领航者编队中引入虚拟领航者并改进编队保持方式;使用深度强化学习算法在建模场景中对水下机器人编队路径规划进行训练,不断试错迭代,训练网络模型;在深度强化学习训练水下机器人路径规划时引入人工势场法;将训练好的网络模型与LOS制导算法通过TCP/IP进行通讯实现深度强化学习在水下机器人中进行实时决策,达到编队路径规划的效果;在LOS制导实时反馈和深度强化学习实时决策之间不断交互,为水下机器人编队提供实时的路径规划并最终到达目标点。
技术关键词
路径规划方法
虚拟领航者
人工势场法
深度强化学习算法
水下机器人系统
深度强化学习模型
障碍物
制导算法
分层强化学习
决策
网络
仿真环境
空间直角坐标系
分层策略
推力