摘要
本发明公开了一种无线通信多维度联合抗干扰方法及系统,其中,方法包括:在干扰环境中,将通信方所需的抗干扰决策建模为马尔科夫决策过程;确定马尔科夫决策过程的状态与动作,得出状态空间与动作空间,以及对应的状态‑动作矩阵即Q表,并初始化;确定马尔科夫决策过程的即时奖励函数,计算动作对应的即时奖励值,并作为更新Q表中对应Q值的关键依据;基于贪婪策略算法,选择当前状态下的动作,执行动作后获得相应的奖励值,记录并更新Q表中的Q值,并转移到下一时刻状态;将通信方发射机的动作‑价值函数迭代至收敛或迭代到指定的次数,得到最终的Q表,输出发射机最佳抗干扰结果。本发明能够动态适配不同干扰场景,做出智能抗干扰决策。