一种基于强化学习的综合化航空电子系统可调度分析方法

申请号：CN202510013428

申请日期：2025-01-06

公开号：CN119806783A

公开日期：2025-04-11

类型：发明专利

摘要

本发明提出了一种基于强化学习的综合化航空电子系统可调度分析方法，包括：根据综合化航空电子系统可调度问题设计马尔可夫决策过程，构建虚拟环境；将基于价值的强化学习算法与多头注意力机制进行结合，通过智能体与虚拟环境进行交互，学习得到最优状态‑动作值函数；当智能体与环境进行交互时，使用最优状态‑动作值函数，获得当前状态下每个可行动作的价值；选择具有最高价值的可行动作，并执行该可行动作；获取下一个状态和奖励，并将奖励累加；或者将基于策略的强化学习算法与多头注意力机制进行结合，学习得到最优策略函数；使用最优策略函数获得若干预选动作，执行得分最高的候选动作序列。

技术关键词

综合化航空电子系统调度分析方法多头注意力机制强化学习算法分区策略决策核心周期更新网络参数模块超参数序列解码器编码器任务调度