摘要
本发明公开了基于增强学习训练的无人机自适应优化方法,包括:S1、构建无人机状态空间,将状态空间下的飞行决策动作进行离散化,构建动作空间;S2、通过近端策略优化算法搭建动作学习模型;S3、获取状态空间中无人机执行任务的动态数据;S4、通过获取的状态信息,从动作空间中选择一个飞行决策动作,执行所选动作后,获取新的状态以及对应的奖励值;S5、将当前状态、执行的动作和获得的奖励值以及新状态存储到经验回放缓冲区中;S6、从缓冲区中随机采样一批数据,训练飞行学习模型,做出飞行决策,直至飞行任务完成。本发明能够实时感知环境变化,自主学习做出最优飞行决策,提高无人机任务执行能力。