摘要
本发明属于飞机智能体航迹规划技术领域,具体地涉及一种基于集中式改进PPO算法的协同航迹规划方法。包括:步骤1:针对协同打击任务,将攻击机和干扰机/诱饵机组成局部编队,建立基于局部编队的协同航迹规划模型;步骤2:引入策略训练技巧,建立基于集中式BRPPO贝塔循环近端策略优化算法的下层协同航迹规划模型,飞机智能体在航迹规划环境中迭代循环,求解最优策略,该最优策略即协同航迹规划。本发明提出了离线训练、在线规划的协同航迹规划方法,省去了在线优化的时间,提高了航迹规划的求解速度和实时性;本发明采用基于学习的神经网络求解端到端非线性近似最优航迹,提高了航迹规划的精度和最优性,有利于实施多机精细航迹和战术配合。