摘要
本申请实施例提供了一种基于PPO算法的水下机器人姿态控制方法及装置,属于计算机技术领域。该方法包括:构建第一动力学模型,根据第一动力学模型确定第一训练样本;将拍摄目标处于拍摄画面中央时水下机器人的姿态确定为预设姿态,根据第一训练样本与预设姿态确定第二训练样本;基于Actor‑Critic机制构建深度神经网络,将第二训练样本输入深度神经网络进行训练,得到训练完毕的目标深度神经网络;采用该深度神经网络对第一动力学模型进行更新,得到第二动力学模型;基于第二动力学模型和第一干扰值对水下机器人进行姿态控制。本发明能优化动力学模型,保证水下机器人在复杂水下环境中的拍摄稳定性和控制精度。