基于分层强化学习的攻击时间约束制导方法及相关装置

申请号：CN202511011340

申请日期：2025-07-22

公开号：CN120686587A

公开日期：2025-09-23

类型：发明专利

摘要

本发明属于航空航天技术领域，公开了一种基于分层强化学习的攻击时间约束制导方法及相关装置；其中，所述基于分层强化学习的攻击时间约束制导方法包括：获取飞行器的导引头对于机动目标的量测信息，并利用训练好的双层智能体模型进行飞行制导，输出制导加速度指令；双层智能体模型中，上层深度强化学习智能体用于根据导引头量测信息自适应调整期望视线角曲线和视线角速率曲线生成参考轨迹；下层深度强化学习智能体用于接收参考轨迹和导引头量测信息，生成制导加速度指令。本发明公开的技术方案，有效解决了现有方法在应对高速机动目标时剩余飞行时间难以精确估计的技术难题。

技术关键词

深度强化学习分层强化学习双层智能制导方法网络数学模型飞行器加速度曲线策略速率最小化误差非暂态计算机可读存储介质参数决策航空航天技术轨迹指令样本制导系统