摘要
本发明公开了一种基于渐进式通信的多智能体全局共识协同方法,涉及多智能体深度强化学习技术领域,本发明通过编码模块更新智能体i的自身认知通过注意力模块生成权重向量αi和通信信息根据权重向量αi的相似性将智能体进行分组,并生成通信掩码MASK1和MASK2;通信模块在第一阶段将信息和掩码MASK1作为局部视觉转换器的输入生成局部共识hL,在第二阶段将局部共识hL和掩码MASK2作为全局视觉转换器的输入促进形成全局共识hG;Q‑值模块将智能体i的自身认知局部共识和全局共识作为输入生成Q‑值函数建立KL散度模块和重构模块,促进多智能体之间全局共识的对齐。本发明的优点在于提出一种渐进式的多智能体通信方法来逐步推动全局共识的达成。