摘要
本发明涉及一种多智能体系统无碰撞的快速编队控制方法,首先通过零空间投影的方法,建立快速编队与避障的复合任务;然后将动态任务优先级规划问题转化为一个切换模式最优控制问题;最后引入强化学习任务监督器,基于集中式训练分布式执行的学习范式,实现任务模式的最优切换性能。本发明结合了多智能体强化学习方法和零空间投影方法的思想,解决了多智能体系统无碰撞的快速编队控制方法问题,无需人为设定任务优先级的切换条件,能大量减少研究人员的工作量;此外,本发明在编队控制中引入了动量项加快编队控制收敛速度,使得其较于传统的方法具有更加理性的编队避障和切换效果。