摘要
本发明属于航空航天技术领域,公开了一种基于分层强化学习的攻击时间约束制导方法及相关装置;其中,所述基于分层强化学习的攻击时间约束制导方法包括:获取飞行器的导引头对于机动目标的量测信息,并利用训练好的双层智能体模型进行飞行制导,输出制导加速度指令;双层智能体模型中,上层深度强化学习智能体用于根据导引头量测信息自适应调整期望视线角曲线和视线角速率曲线生成参考轨迹;下层深度强化学习智能体用于接收参考轨迹和导引头量测信息,生成制导加速度指令。本发明公开的技术方案,有效解决了现有方法在应对高速机动目标时剩余飞行时间难以精确估计的技术难题。