摘要
本发明公开了火箭着陆控制方法技术领域的一种基于多智能体强化学习的火箭着陆控制方法,该火箭着陆控制方法包括以下步骤:建立火箭发动机模型,采集并输出液体火箭发动机工作过程中所必须的状态参数;建立运载火箭垂直降落仿真模型,采集并输出与运载火箭垂直降落过程中所必须的参数;定义发动机起动过程中的状态空间、动作空间和奖励函数;在MADDPG算法的基础上,进行改进,实现LCO‑MADDPG算法;设计、训练和评估MARL模型。该火箭着陆控制方法通过智能化控制方法,无需设计复杂的控制逻辑,实现运载火箭垂直降落过程控制的非线性控制。