摘要
本发明涉及信息技术技术领域,具体涉及基于强化学习和径向基函数神经网络的自适应控制方法,包括:建立具有未知时变不确定性的非线性系统的状态方程,定义系统状态变量和控制目标;在强化学习框架下,初始化控制策略和价值函数,设定初始网络参数,初步估计不确定性的上确界;利用径向基函数神经网络对系统的不确定性进行实时估计,通过调整径向基函数神经网络的参数,逼近不确定性的上确界;基于估计的不确定性,对控制策略进行迭代更新,在每次迭代中,利用强化学习算法优化控制策略;实时调整控制策略,基于最新的不确定性估计值,对控制策略参数进行优化,并通过收敛性分析得到最终稳定的控制策略。通过本发明,有效解决了需要预先知道不确定性上界的问题,提高了系统鲁棒性和控制精度,动态自适应能力强,简化了控制策略设计,增强了系统稳定性和响应效率。