一种基于PPO算法的水下机器人姿态控制方法及装置

申请号：CN202411494304

申请日期：2024-10-24

公开号：CN119414865B

公开日期：2025-11-28

类型：发明专利

摘要

本申请实施例提供了一种基于PPO算法的水下机器人姿态控制方法及装置，属于计算机技术领域。该方法包括：构建第一动力学模型，根据第一动力学模型确定第一训练样本；将拍摄目标处于拍摄画面中央时水下机器人的姿态确定为预设姿态，根据第一训练样本与预设姿态确定第二训练样本；基于Actor‑Critic机制构建深度神经网络，将第二训练样本输入深度神经网络进行训练，得到训练完毕的目标深度神经网络；采用该深度神经网络对第一动力学模型进行更新，得到第二动力学模型；基于第二动力学模型和第一干扰值对水下机器人进行姿态控制。本发明能优化动力学模型，保证水下机器人在复杂水下环境中的拍摄稳定性和控制精度。

技术关键词

水下机器人推进器构建深度神经网络坐标系表达式矩阵坐标误差姿态控制装置姿态控制系统画面观测器机制计算机程序产品处理器模块力矩