一种基于改进DDPG算法的海洋无人集群围捕机动决策方法
申请号:CN202510534670
申请日期:2025-04-27
公开号:CN120069018B
公开日期:2025-07-04
类型:发明专利
摘要
本申请公开了一种基于改进DDPG算法的海洋无人集群围捕机动决策方法,具体涉及海洋无人集群博弈决策的领域。包括:获取每个航行器的前一时刻状态位置,分别将每个航行器的前一时刻状态位置输入LSTM网络,对应得到每个航行器的历史状态位置;将每个航行器的历史状态位置输入对应的预训练的DDPG网络,确定每个航行器的执行动作,得到海洋无人集群围捕机动决策;其中,预训练的DDPG网络在训练过程中,奖励值为个体奖励、团队奖励及额外奖励之和。可以进一步提高围捕成功率。
技术关键词
海洋无人
决策方法
网络
集群
策略
航行器
算法
团队
梯度下降法
生成动作
参数
物体
样本
障碍物
坐标