摘要
本发明公开了一种外骨骼机器人稳定行走的控制方法及装置,所述方法包括:基于无拐杖自平衡下肢外骨骼机器人模型,构建增广系统的状态空间表达式;基于增广系统的状态空间表达式,使用基于状态反馈PI策略的on‑policy数据驱动Q学习算法求解控制问题;所述基于状态反馈PI策略的on‑policy数据驱动Q学习算法利用沿着系统轨迹测量的系统状态信息,通过不断迭代更新逼近动态规划方法中的成本函数和控制律,从而在线实时的解决最优控制问题。本发明使外骨骼机器人能够在未知用户物理参数的情况下依然保持稳定行走,从而提高无拐杖自平衡下肢外骨骼机器人的适用范围与实际应用价值。