一种基于渐进式通信的多智能体全局共识协同方法

申请号：CN202510285412

申请日期：2025-03-11

公开号：CN120387475A

公开日期：2025-07-29

类型：发明专利

摘要

本发明公开了一种基于渐进式通信的多智能体全局共识协同方法，涉及多智能体深度强化学习技术领域，本发明通过编码模块更新智能体i的自身认知通过注意力模块生成权重向量αi和通信信息根据权重向量αi的相似性将智能体进行分组，并生成通信掩码MASK1和MASK2；通信模块在第一阶段将信息和掩码MASK1作为局部视觉转换器的输入生成局部共识hL，在第二阶段将局部共识hL和掩码MASK2作为全局视觉转换器的输入促进形成全局共识hG；Q‑值模块将智能体i的自身认知局部共识和全局共识作为输入生成Q‑值函数建立KL散度模块和重构模块，促进多智能体之间全局共识的对齐。本发明的优点在于提出一种渐进式的多智能体通信方法来逐步推动全局共识的达成。

技术关键词

协同方法多智能体深度强化学习技术转换器重构模块多层感知器门控循环单元全局通信编码模块多智能体强化学习视觉编码器通信模块深度神经网络混合网络生成智能解码器信息通信注意力机制