一种混合奖励机制和自适应调整驱动的多无人机动态目标覆盖方法

申请号：CN202410854997

申请日期：2024-06-28

公开号：CN118838415A

公开日期：2024-10-25

类型：发明专利

摘要

本发明提出了一种基于混合奖励机制和自适应调整驱动的多无人机动态目标覆盖方法，属于无人机的智能自主协同控制领域。对多无人机动态目标覆盖任务进行系统建模，包括建立无人机的运动学模型以及动态目标选择模型；将多无人机动态目标覆盖建模为马尔科夫决策过程，包括设计无人机的状态空间、动作空间以及奖励函数；通过将无人机覆盖建模为马尔科夫决策过程，设计自适应学习函数，使用TSA‑MADDPG算法对无人机进行训练，得到无人机的动态目标覆盖策略模型，利用该策略模型部署与控制无人机以完成动态目标覆盖任务。多无人机相互合作形成多智能体系统，可以充分弥补单无人机的缺陷，更能够在复杂和多任务的场景中工作。

技术关键词

动态设计无人机机制笛卡尔坐标系控制无人机无人机飞行速度代表策略多智能体系统引导无人机决策网络多无人机算法多任务参数阻尼因子