摘要
本发明公开异构无人集群协同围捕方法、装置、设备及存储介质,涉及智能体自动控制的技术领域,该方法包括:明确多智能体协同围捕系统的异构无人集群、环境信息以及约束条件,并构建多智能体协同围捕系统的物理模型;在每个决策周期开始时,将多智能体的任务分配问题建模为“最大流‑最小成本”的图论问题,构建任务分配有向图,确定每个智能体对应的个体捕获目标,基于PPO框架,以每个智能体完成对应的个体捕获目标的回报最大为个体目标,以异构无人集群完成所有捕获目标的回报最大为全局目标,引导智能体学习最优围捕策略。本发明解决了现有技术在处理异构能力约束方面存在明显不足的问题。