摘要
本申请提供了一种基于深度强化学习的飞艇路径规划方法及系统,该方法包括:将动态风场信息和飞艇自身状态信息输入训练好的策略网络中,得到规划的飞艇推进速度和航向角度;所述策略网络通过近端策略优化方法进行训练;所述动态风场信息,为使用移动窗口截取预报风场,将预报风场与探测风速信息进行高斯增强风场融合和风场不确定度等风场信息;动态风场信息通过策略网络的卷积神经网络提取特征,通过风场信息与飞艇状态信息融合后通过策略网络的全连接网络计算飞艇动作。本申请的优势在于:通过融合飞艇探空数据和预报风场,给飞艇的路径规划提供了更加准确的风场数据和风场的不确定性信息;通过精心设计的奖励函数,提高了模型的实用性和可靠性。