一种混合奖励机制和自适应调整驱动的多无人机动态目标覆盖方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种混合奖励机制和自适应调整驱动的多无人机动态目标覆盖方法
申请号:CN202410854997
申请日期:2024-06-28
公开号:CN118838415A
公开日期:2024-10-25
类型:发明专利
摘要
本发明提出了一种基于混合奖励机制和自适应调整驱动的多无人机动态目标覆盖方法,属于无人机的智能自主协同控制领域。对多无人机动态目标覆盖任务进行系统建模,包括建立无人机的运动学模型以及动态目标选择模型;将多无人机动态目标覆盖建模为马尔科夫决策过程,包括设计无人机的状态空间、动作空间以及奖励函数;通过将无人机覆盖建模为马尔科夫决策过程,设计自适应学习函数,使用TSA‑MADDPG算法对无人机进行训练,得到无人机的动态目标覆盖策略模型,利用该策略模型部署与控制无人机以完成动态目标覆盖任务。多无人机相互合作形成多智能体系统,可以充分弥补单无人机的缺陷,更能够在复杂和多任务的场景中工作。
技术关键词
动态 设计无人机 机制 笛卡尔坐标系 控制无人机 无人机飞行速度 代表 策略 多智能体系统 引导无人机 决策 网络 多无人机 算法 多任务 参数 阻尼 因子