一种无人艇逃脱深度强化学习训练方法

申请号：CN202411941652

申请日期：2024-12-26

公开号：CN120087442A

公开日期：2025-06-03

类型：发明专利

摘要

一种无人艇逃脱深度强化学习训练方法，该方法针对无人艇逃脱场景，采用深度强化学习策略训练无人艇逃脱策略的情况，设定了状态空间与环境奖励，对无人艇所处环境部分状态进行筛选，设定合理的逃脱策略状态，既能反应无人艇逃脱时所要关注状态，又不将状态复杂化；从逃脱成功、逃脱失败、逃脱时间、航向角角度、航向角角速度等多方面对无人艇逃脱时的环境奖励进行综合设定，使无人艇逃脱策略训练能够收敛达到理想训练效果。

技术关键词

无人艇深度强化学习强化学习策略 SAC算法网络速度场景运动坐标定义框架