摘要
本发明涉及人工智能与无人机技术领域,且公开了一种基于深度强化学习的多无人机协作导航方法,适用于复杂动态环境中的多智能体任务执行,方法采用多智能体双重深度Q网络模型构建,结合集中式训练与分布式执行架构,在训练阶段,通过全局状态优化协作策略,在执行阶段,各无人机根据局部观测自主决策,并基于通信负载感知机制动态调整信息同步频率,从而降低通信带宽占用并提升系统实时性,方法还引入经验回放与优先级采样机制,提升模型稳定性和收敛速度,系统可实时感知障碍物信息、能耗水平与其他无人机状态,实现路径动态优化与队形保持,具备良好的任务适应性和可扩展性,适用于异构无人机系统的协同导航应用。