摘要
本发明公开了基于值进化强化学习的无人机协同搜索航迹规划方法,能够进行多无人机协同搜索航迹规划,实现了针对复杂不确定性模型的搜索环境的建模,建立了多无人机协同搜索航迹规划模型中的概率地图模型,同时克服算法在多无人机协同搜索任务中学习能力不足的问题,提升无人机集群在复杂协同搜索任务中的学习效率与决策性能。具体步骤为:建立多无人机协同搜索航迹规划模型;建立多无人机协同搜索航迹规划的马尔可夫决策过程模型;构建通过强化学习训练的神经网络,对应RL个体;构建通过值进化机制优化的神经网络种群,对应EA个体种群:对所构建的神经网络进行强化学习训练和值进化优化:使用优化的神经网络,进行多无人机协同搜索航迹规划。