基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法

申请号：CN202411584075

申请日期：2024-11-07

公开号：CN119439743B

公开日期：2025-11-14

类型：发明专利

摘要

本发明公开了基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法，包括以下步骤：S1、通过relu激活网络对系统动力学模型和不确定性边界进行建模；S2、确定鲁棒性条件，并将其用于预先确定吸引域的面积；S3、确定动力学模型不确定性和状态估计下的鲁棒性保证RL；S4、网络参数化建立；S5、对倒立摆和四旋翼无人机进行数值模拟。本发明采用上述的基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法，仍然可以准确地找到最违逆的状态，从而强制其在不确定性下的稳定性，给出了鲁棒RL问题解存在性的几何视图来解释鲁棒性及其能力，在各种不确定性下对倒立摆和四旋翼机的数值模拟证明了所提出方法的有效性。

技术关键词

李雅普诺夫函数不确定性系统鲁棒性分段线性函数旋翼无人机混合整数线性规划顶点损失函数设计分区学习控制器网络特征值嵌套机器人系统参数饱和度表达式旋翼机