摘要
本发明公开了一种无人机飞行活动全流程任务调度优化方法,涉及飞行活动任务调度技术领域,本发明提的离线阶段利用历史数据构建状态向量,该状态向量由任务紧迫性、地理分布、当前天气、障碍物概率以及电量余量构成,同时依据任务完成时限、飞行安全成本及资源消耗成本构造奖励函数,任务启动时,引入现场实时传感器数据,对离线获得的初始状态进行修正,形成新的状态向量,并利用深度Q网络输出最优动作,生成反映当前环境状况的任务分配方案,既依赖离线学习成果,又能够及时反映实时变化,缓解传统调度中静态模型与现场实际脱节的问题;离线深度强化学习模型与在线实时数据反馈闭环相结合,实现全局调度与局部路径重规划的动态协同。