摘要
本发明提供一种基于深度强化学习的异构无人机群分簇方法及系统,属于无线通信技术领域,所述方法包括:基于异构无人机群数据传输网络,创建与环境进行交互的多智能体深度强化学习网络,并初始化簇头智能体和簇成员智能体的奖励函数;获取簇头智能体的观察信息和可能动作,以及,簇成员智能体的观察信息和可能动作,以分别用于簇头智能体和簇成员智能体的策略模型训练;簇头智能体和簇成员智能体分别采用多智能体近端策略优化算法和独立近端策略优化方法训练策略模型;调用训练完成的策略模型,完成无人机群自主分簇。本发明优化了无人机数据传输网络的通信效能,提升了异构无人机群频谱共享的智能化和自动化水平。