摘要
本发明提出了一种基于强化学习和图神经网络的空域规划方法,旨在解决传统空域扇区规划方法存在设计繁杂、灵活性与泛化性欠佳的问题。本发明综合运用深度强化学习及图注意力神经网络技术构建模型,以均衡扇区工作负荷为划分目标并满足连通性约束。该方法包括输入空域负荷数据,搭建含特定状态空间、动作空间和奖励函数的空域规划环境与智能体,初始化并训练智能体,利用训练好的智能体划分扇区给出规划方案。模型基于GCN及PPO算法,通过GCN提取特征,模型对不满足约束的解进行屏蔽,确保分区连通性。通过这种方法,可以实现更高效、灵活和泛化的空域规划。