基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统

申请号：CN202511403591

申请日期：2025-09-29

公开号：CN120871645B

公开日期：2025-12-05

类型：发明专利

摘要

本发明公开了一种基于瓦瑟斯坦距离的多智能体系统双层Q学习控制方法及系统，该方法包括建立在故障与未知分布干扰下的多智能体系统状态空间模型；构建内层容错控制系统与外层鲁棒控制系统；基于Q学习算法设计内部容错控制增益；基于瓦瑟斯坦距离及零和博弈框架设计外层鲁棒控制增益和偏置项；结合邻域状态信息设计分布式一致性协议。本方法在系统模型未知、执行器存在加性时变故障、外部扰动概率分布不确定且仅凭有限样本的情况下，能够有效降低补偿故障与扰动的影响，并且在满足H无穷性能约束的同时，实现所有智能体的渐近状态同步，确保系统稳定。

技术关键词

鲁棒控制系统容错控制系统学习控制方法多智能体系统 Q学习算法数学模型执行器分布式一致性控制分布式一致性协议学习控制系统容错控制器状态空间模型信号矩阵邻域