融合经验共享与平衡奖励Actor-Critic网络的编队路径规划方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
融合经验共享与平衡奖励Actor-Critic网络的编队路径规划方法
申请号:CN202411087223
申请日期:2024-08-08
公开号:CN118915772A
公开日期:2024-11-08
类型:发明专利
摘要
本发明公布了融合经验共享与平衡奖励Actor‑Critic网络的编队路径规划方法,所述方法首先构建无人机编队路径规划的任务场景;其次通过设定编队与路径规划平衡奖励,根据稀疏性和信息性准则求解平衡的编队奖励和路径奖励;然后根据经验共享策略使得每个无人机能够在自身学习探索的同时获取其他无人机的学习经验;最后在对整个模型完成训练后,在动态环境下实现了无人机编队路径规划。本发明基于多智能体演员‑评论家算法基本框架,利用平衡奖励设定编队与路径规划奖励,提出经验共享策略,有效解决了编队路径规划方法收敛速度较慢的问题,可确保编队无人机实现高效路径规划。
技术关键词
路径规划方法 策略 更新网络参数 终点 构建无人机 编队无人机 表达式 距离信息 场景 定义 障碍物 算法 速度 决策 总量
系统为您推荐了相关专利信息
高压EGR系统 发动机工况 EGR阀 发动机本体 控制策略
安全监控方法 历史访问记录 字段 风险 神经网络模型
储能优化配置方法 储能荷电状态 演化博弈模型 充放电功率 演化策略
识别一体化方法 编码模块 场景 建筑 双通道特征融合
知识点 学习路径推荐方法 学生 学习能力评估 学习历史数据