摘要
本发明公开了一种基于AI的无人机停机调度系统,包括预定义模块、奖励函数设计模块、行为选择设计模块、远期目标优化模块、重要样本回放模块和无人机停机调度模块。本发明属于资源调度领域,具体是指一种基于AI的无人机停机调度系统,本方案通过引入负载均衡奖励,确保群体资源能够有效分配;引入进度反馈奖励,动态衡量系统整体的进度和资源利用情况;基于逐步探索减少策略应对突发情况,提高整体停机调度效果;通过引入远期目标优化,在长时间调度场景中,能够更好地应对复杂问题;能够避免局部最优,而是通过全局视角优化资源分配;并引入重要样本回放,通过优先级采样加速调度系统学习;进而提高无人机停机调度稳定性。