融合经验共享与平衡奖励Actor-Critic网络的编队路径规划方法
申请号:CN202411087223
申请日期:2024-08-08
公开号:CN118915772A
公开日期:2024-11-08
类型:发明专利
摘要
本发明公布了融合经验共享与平衡奖励Actor‑Critic网络的编队路径规划方法,所述方法首先构建无人机编队路径规划的任务场景;其次通过设定编队与路径规划平衡奖励,根据稀疏性和信息性准则求解平衡的编队奖励和路径奖励;然后根据经验共享策略使得每个无人机能够在自身学习探索的同时获取其他无人机的学习经验;最后在对整个模型完成训练后,在动态环境下实现了无人机编队路径规划。本发明基于多智能体演员‑评论家算法基本框架,利用平衡奖励设定编队与路径规划奖励,提出经验共享策略,有效解决了编队路径规划方法收敛速度较慢的问题,可确保编队无人机实现高效路径规划。
技术关键词
路径规划方法
策略
更新网络参数
终点
构建无人机
编队无人机
表达式
距离信息
场景
定义
障碍物
算法
速度
决策
总量