摘要
本发明涉及机场特种车辆调度技术领域,具体涉及一种基于深度强化学习的机场特种车辆调度方法及系统,步骤如下:以对航班服务的时间最短为目标,将机场特种车辆调度问题建模为带时间窗的车辆路径规划问题,根据各类型特种车辆预设服务优先级对车辆路径规划问题进行分解;对每个子问题进行马尔可夫决策过程建模,搭建基于注意力机制的神经网络模型,并利用神经网络模型生成车辆规划的路径解,根据各子问题的路径解计算总回报,基于总回报的奖励采用深度强化学习算法训练神经网络模型,得到训练后的神经网络模型,利用训练后的神经网络模型求解机场特种车辆调度问题。本发明可实现多类型特种车辆以及多种机型的机场特种车辆调度求解,计算效率更高。