基于模仿学习的拦截机动目标强化学习制导律设计方法和装置

申请号：CN202411912187

申请日期：2024-12-24

公开号：CN119828462B

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了基于模仿学习的拦截机动目标强化学习制导律设计方法和装置，属于制导律设计技术领域。本发明先以拦截碰撞三角为基础，建立机动目标和拦截器三维不确定对抗模型；然后以比例导引制导律为策略，利用交互环境生成大量轨迹样本，建立智能末制导模型，采用监督学习方法对其进行训练，得到逼近比例导引拦截性能的智能末制导模型；最后利用强化学习方法，设置奖励函数，采用PPO算法对模仿学习得到的智能末制导模型进一步的进行训练，得到超越比例导引拦截性能的新型制导律。仿真结果表明，该新型制导律鲁棒性好、稳定性高，实现了比传统制导算法更高的拦截概率和更低的能量消耗，且单次决策耗时仅0.32ms，具有一定的工程应用价值。

技术关键词

制导律设计方法拦截器神经网络模型参数更新方法监督学习方法强化学习方法策略深度强化学习脱靶量雅克比矩阵样本更新网络参数能量消耗制导算法雅可比矩阵轨迹模块误差矩阵

系统为您推荐了相关专利信息

一种餐厨垃圾处理过程中废气排放远程管理系统

卷积神经网络模型餐厨垃圾处理远程管理系统实时数据废气排放口

一种基于机器学习的城市建筑单元数据获取方法

数据获取方法建筑单元数据处理中心光学遥感相机三维探地雷达

一种设备远程智能监控管理系统及方法

后台服务器图像特征提取卷积神经网络模型无线传输模块远程智能监控

锅炉燃烧控制方法、装置、设备及存储介质

锅炉燃烧控制方法燃烧控制程序参数火电锅炉燃烧控制装置

一种对抗式飞鸟场景伪红外图像生成方法

生成神经网络模型可见光图像图像生成方法图像边缘特征循环对抗生成网络