一种基于强化学习的飞行特情任务训练质量提升方法及系统

申请号：CN202411444235

申请日期：2024-10-16

公开号：CN119357531B

公开日期：2025-04-29

类型：发明专利

摘要

本发明公开了一种基于强化学习的飞行特情任务训练质量提升方法及系统，方法包括以下步骤：S1：基于目标飞机特情任务，构建飞行动力学模型、特情任务模型，建立强化学习环境。基于飞行安全操作要求建立奖励函数。S2：建立混合Actor‑Critic网络，并使用策略分离近端策略优化(Actor‑Separated Proximal Policy Optimization,ASPPO)算法训练特情处置决策网络，得到最优控制智能体。S3：基于最优控制智能体，生成多组动作序列集，并分析序列集中最大频繁动作序列，识别出操作动作偏时、动作多余、动作遗漏、动作错序的问题。

技术关键词

强化学习环境动作策略飞行动力学模型频繁序列模式多层感知网络决策飞机算法元素识别模块提升系统参数数据分支因子