摘要
一种基于数据驱动的工程系统容错跟踪控制方法,属于工程控制方法技术领域。包括如下步骤:S1、建立故障下工程系统等价模型,定义性能指标函数和相应的值函数,从而将最优控制问题转化为零和博弈问题;S2、针对工程系统状态不可测的问题,利用历史输入输出数据对状态进行重构,从而设计求解最优控制策略;S3、引入并定义Q函数,对控制器增益及扰动增益进行设计,并结合设计的无模型非策略Q‑学习输出反馈算法对优化,得到最优控制器。通过注塑成型工业过程和自治水下机器人(AUV)的深度控制仿真实验,验证了该算法的收敛性以及所设计控制器优良的跟踪控制效果。