摘要
本发明为一种基于TD3‑PSO算法的无人机路径规划方法。包括如下步骤:(1)建立以飞行距离、飞行高度、飞行偏转角及避障能力为指标的路径模型;(2)将四个指标的评价函数加权求和,建立适应度函数,基于适应度函数采用改进粒子群算法寻找最优路径,在寻优过程中陷入局部最优解时,对最佳粒子位置进行变异操作;(3)采取双Critic网络模块构建深度强化学习网络模型,并进行离线训练;(4)采用改进粒子群算法基于适应度函数寻找最优路径。本发明提出了基于双延迟深度确定性策略梯度训练粒子群算法关键参数的框架,能够输出连续动作空间,有效解决了算法参数设置的难题,有助于在高维度问题中找到最优路径。