摘要
本发明公开了一种基于深度强化学习的无人机目标追踪方法及系统,该方法包括构建无人机目标追踪仿真模拟器;构建基于Resnet的特征提取网络;构建深度强化学习网络,包括:用于评估环境更新后的奖励值并反向更新策略网络的价值网络,用于根据特征提取网络提取的深度特征输出推荐的无人机行进方向及速度的策略网络;预训练深度强化学习网络并在无人机目标追踪仿真模拟器中进行强化学习训练;进行实际追踪。本发明将目标中心与视野中心距离作为衡量奖励的标准,降低计算复杂度并提高目标特征提取能力,使无人机在面临背景复杂、目标形变、目标丢失的追踪问题时表现出较强的适应能力和自主决策,能够应用于实机追踪。