一种基于DDPG的雷达干扰决策方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于DDPG的雷达干扰决策方法
申请号:CN202410919738
申请日期:2024-07-10
公开号:CN118897264A
公开日期:2024-11-05
类型:发明专利
摘要
本发明公开了一种基于DDPG的雷达干扰决策方法,该方法首先采用马尔科夫决策过程对雷达干扰交互场景,进行强化学习问题建模。其次针对行强化学习问题建模,使用改进的DDPG算法,解决混合动作空间中的干扰决策问题。然后在模拟突防中,使用改进的DDPG算法进行干扰决策,产生干扰动作回传给强化学习问题建模,获得下一状态、返回干扰动作的奖励函数;循环迭代本步骤,直到DDPG算法在每一轮突防中,返回奖励函数的总和趋于稳定。最后在实际突防中,使用迭代得到的DDPG算法,根据状态输入进行干扰动作决策。本发明可在少量先验知识的基础上,从干扰机与雷达干扰场景的交互中进行学习,实现干扰突防的效果。
技术关键词
雷达干扰决策方法 模式 算法 随机噪声 雷达接收机 噪声因子 网络 状态更新 场景 变量 信噪比 节点 样式 天线 波长 损耗 编码