基于模仿学习的拦截机动目标强化学习制导律设计方法和装置
申请号:CN202411912187
申请日期:2024-12-24
公开号:CN119828462B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于模仿学习的拦截机动目标强化学习制导律设计方法和装置,属于制导律设计技术领域。本发明先以拦截碰撞三角为基础,建立机动目标和拦截器三维不确定对抗模型;然后以比例导引制导律为策略,利用交互环境生成大量轨迹样本,建立智能末制导模型,采用监督学习方法对其进行训练,得到逼近比例导引拦截性能的智能末制导模型;最后利用强化学习方法,设置奖励函数,采用PPO算法对模仿学习得到的智能末制导模型进一步的进行训练,得到超越比例导引拦截性能的新型制导律。仿真结果表明,该新型制导律鲁棒性好、稳定性高,实现了比传统制导算法更高的拦截概率和更低的能量消耗,且单次决策耗时仅0.32ms,具有一定的工程应用价值。
技术关键词
制导律设计方法
拦截器
神经网络模型
参数更新方法
监督学习方法
强化学习方法
策略
深度强化学习
脱靶量
雅克比矩阵
样本
更新网络参数
能量消耗
制导算法
雅可比矩阵
轨迹
模块
误差矩阵