基于值进化强化学习的无人机协同搜索航迹规划方法

申请号：CN202511033817

申请日期：2025-07-25

公开号：CN120871931A

公开日期：2025-10-31

类型：发明专利

摘要

本发明公开了基于值进化强化学习的无人机协同搜索航迹规划方法，能够进行多无人机协同搜索航迹规划，实现了针对复杂不确定性模型的搜索环境的建模，建立了多无人机协同搜索航迹规划模型中的概率地图模型，同时克服算法在多无人机协同搜索任务中学习能力不足的问题，提升无人机集群在复杂协同搜索任务中的学习效率与决策性能。具体步骤为：建立多无人机协同搜索航迹规划模型；建立多无人机协同搜索航迹规划的马尔可夫决策过程模型；构建通过强化学习训练的神经网络，对应RL个体；构建通过值进化机制优化的神经网络种群，对应EA个体种群：对所构建的神经网络进行强化学习训练和值进化优化：使用优化的神经网络，进行多无人机协同搜索航迹规划。

技术关键词

航迹规划方法多无人机协同混合网络多层感知机置信度阈值门控循环单元无人机集群无人机系统地图模型卷积神经网络提取不确定性模型无人机模型固定翼无人机更新网络参数状态空间模型智能体系统