摘要
本发明公开了一种基于分层强化学习的多无人机未知区域目标搜索方法,包括:将包括多个目标和多个障碍物的搜索区域划分为若干个搜索网格,并为多个无人机各自分配一个搜索网格,利用无人机对搜索区域进行搜索,获得搜索数据并传至地面站;在地面站,基于集中式训练、分布式执行和分层强化学习框架,训练一个区域覆盖协调策略网络作为上层决策网络;训练一个目标追踪识别策略网络作为下层决策网络;将区域覆盖协调策略网络和目标追踪识别策略网络集成到每个无人机上,以指导无人机执行目标搜索任务。该方法在多无人机协同目标搜索任务中实现了高效搜索区域覆盖、持续跟踪以及动态避障能力,并且通过集中式训练、分布式执行提高了算法的鲁棒性。