一种基于改进DDPG算法的海洋无人集群围捕机动决策方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于改进DDPG算法的海洋无人集群围捕机动决策方法
申请号:CN202510534670
申请日期:2025-04-27
公开号:CN120069018B
公开日期:2025-07-04
类型:发明专利
摘要
本申请公开了一种基于改进DDPG算法的海洋无人集群围捕机动决策方法,具体涉及海洋无人集群博弈决策的领域。包括:获取每个航行器的前一时刻状态位置,分别将每个航行器的前一时刻状态位置输入LSTM网络,对应得到每个航行器的历史状态位置;将每个航行器的历史状态位置输入对应的预训练的DDPG网络,确定每个航行器的执行动作,得到海洋无人集群围捕机动决策;其中,预训练的DDPG网络在训练过程中,奖励值为个体奖励、团队奖励及额外奖励之和。可以进一步提高围捕成功率。
技术关键词
海洋无人 决策方法 网络 集群 策略 航行器 算法 团队 梯度下降法 生成动作 参数 物体 样本 障碍物 坐标