摘要
本发明公开了一种飞行器轨迹智能决策方法、系统、设备及介质,其提出了一种多专家演示引导的智能决策技术,旨在提高飞行器应对复杂环境和多方面性能需求时的智能决策能力,利用不同领域专家的演示数据,引导智能体成为同时具备各个领域能力的综合智能体,即使演示数据采取的是次优策略,智能体也可以通过训练得到更优的策略。同时,本发明设计了分层框架(领航飞行器和跟随飞行器),实现飞行器编队的协同。多专家引导的智能决策结合了模仿学习和深度强化学习的优势,提升了学习效率和策略鲁棒性,提升了智能体的综合性能,为飞行器在复杂环境中的自主化、智能化应用提供可靠解决方案。