一种基于改进DDPG算法的海洋无人集群围捕机动决策方法

申请号：CN202510534670

申请日期：2025-04-27

公开号：CN120069018B

公开日期：2025-07-04

类型：发明专利

摘要

本申请公开了一种基于改进DDPG算法的海洋无人集群围捕机动决策方法，具体涉及海洋无人集群博弈决策的领域。包括：获取每个航行器的前一时刻状态位置，分别将每个航行器的前一时刻状态位置输入LSTM网络，对应得到每个航行器的历史状态位置；将每个航行器的历史状态位置输入对应的预训练的DDPG网络，确定每个航行器的执行动作，得到海洋无人集群围捕机动决策；其中，预训练的DDPG网络在训练过程中，奖励值为个体奖励、团队奖励及额外奖励之和。可以进一步提高围捕成功率。

技术关键词

海洋无人决策方法网络集群策略航行器算法团队梯度下降法生成动作参数物体样本障碍物坐标