摘要
本发明涉及一种含扰动的机械臂轨迹跟踪控制双Q强化学习方法,属于机械臂智能控制技术领域。该方法将采用双Q强化学习方法来解决受干扰的机械臂轨迹跟踪控制问题。设计了一个干扰观测器来估计并抵消外部干扰和模型不准确性的影响,提高机械臂系统的控制精度和干扰抑制能力;设计了一个基于双Q强化学习方法的跟踪控制器,利用双Q学习算法的优越性能,提升系统的动态和稳态性能的同时,保持控制成本;另外利用双Q强化学习方法还解决了传统Q学习方法中遇到的Q值过高的问题。本发明有效利用双Q强化学习方法的优势,在系统含有扰动和不确定因素的情况下,实现机械臂系统对期望轨迹的快速跟踪性能,且具有很好的稳态性能。