基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法
申请号:CN202411584075
申请日期:2024-11-07
公开号:CN119439743B
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开了基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法,包括以下步骤:S1、通过relu激活网络对系统动力学模型和不确定性边界进行建模;S2、确定鲁棒性条件,并将其用于预先确定吸引域的面积;S3、确定动力学模型不确定性和状态估计下的鲁棒性保证RL;S4、网络参数化建立;S5、对倒立摆和四旋翼无人机进行数值模拟。本发明采用上述的基于最差情况的不确定性系统李雅普诺夫稳定强化学习控制算法,仍然可以准确地找到最违逆的状态,从而强制其在不确定性下的稳定性,给出了鲁棒RL问题解存在性的几何视图来解释鲁棒性及其能力,在各种不确定性下对倒立摆和四旋翼机的数值模拟证明了所提出方法的有效性。
技术关键词
李雅普诺夫函数
不确定性系统
鲁棒性
分段线性函数
旋翼无人机
混合整数线性规划
顶点
损失函数设计
分区
学习控制器
网络
特征值
嵌套
机器人系统
参数
饱和度
表达式
旋翼机