基于模仿学习的拦截机动目标强化学习制导律设计方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于模仿学习的拦截机动目标强化学习制导律设计方法和装置
申请号:CN202411912187
申请日期:2024-12-24
公开号:CN119828462B
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于模仿学习的拦截机动目标强化学习制导律设计方法和装置,属于制导律设计技术领域。本发明先以拦截碰撞三角为基础,建立机动目标和拦截器三维不确定对抗模型;然后以比例导引制导律为策略,利用交互环境生成大量轨迹样本,建立智能末制导模型,采用监督学习方法对其进行训练,得到逼近比例导引拦截性能的智能末制导模型;最后利用强化学习方法,设置奖励函数,采用PPO算法对模仿学习得到的智能末制导模型进一步的进行训练,得到超越比例导引拦截性能的新型制导律。仿真结果表明,该新型制导律鲁棒性好、稳定性高,实现了比传统制导算法更高的拦截概率和更低的能量消耗,且单次决策耗时仅0.32ms,具有一定的工程应用价值。
技术关键词
制导律设计方法 拦截器 神经网络模型 参数更新方法 监督学习方法 强化学习方法 策略 深度强化学习 脱靶量 雅克比矩阵 样本 更新网络参数 能量消耗 制导算法 雅可比矩阵 轨迹 模块 误差矩阵
系统为您推荐了相关专利信息
卷积神经网络模型 餐厨垃圾处理 远程管理系统 实时数据 废气排放口
数据获取方法 建筑单元 数据处理中心 光学遥感相机 三维探地雷达
后台服务器 图像特征提取 卷积神经网络模型 无线传输模块 远程智能监控
锅炉燃烧控制方法 燃烧控制程序 参数 火电 锅炉燃烧控制装置
生成神经网络模型 可见光图像 图像生成方法 图像边缘特征 循环对抗生成网络