一种融合图注意力机制的多智能体强化学习编队自适应方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种融合图注意力机制的多智能体强化学习编队自适应方法
申请号:CN202510760477
申请日期:2025-06-08
公开号:CN120540099A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及多智能体协同控制技术领域,公开一种融合图注意力机制的多智能体强化学习编队自适应方法。该方法通过构建动态图状态空间,结合速度自适应通信机制与多目标回报函数,解决智能体数量变化或拓扑结构动态调整时的泛化能力不足问题。方案包括:建立虚拟领导‑跟随编队模型与运动动力学模型;设计基于速度变化的自适应通信半径公式;构建图状态空间,利用多头注意力机制动态聚合邻居信息;设计带残差连接的策略网络与价值评估网络;采用集中式训练分布式执行框架更新模型参数。通过图注意力机制实现关键邻居信息自适应提取,结合动态通信范围调整,提升编队系统在复杂环境中的适应性与稳定性。适用于无人机群控、机器人协作等场景。
技术关键词
策略网络模型 编队协同控制 多头注意力机制 障碍物 多智能体编队 多层感知机 邻居 控制误差 独立编码器 加速度 策略更新方法 执行运动控制 定义 多智能体协同