摘要
本发明提供了一种多无人机充电规划方法、装置、设备及介质,其中,方法包括:通过预设无人机、地面充电站以及目标巡航点,构建无人机运动学方程,获取无人机状态空间;通过指派无人机的目标巡航点使得无人机执行N轮任务,地面充电站对每台需要充电的无人机通过预设的评估函数对无人机进行评分;选取评分最高的预设个数的无人机作为待充电集合,对所述待充电集合进行充电后根据预设的奖赏函数计算每轮任务的奖赏值;选取N轮任务中奖赏值最高的一轮作为最优的充电规划。本申请通过使用启发式DWA算法融入强化学习训练阶段,使得本发明的训练阶段时间大大缩小,同时还提高了模型的精度。