摘要
本发明公开了一种多无人机协同语义通信资源分配与轨迹优化方法,属于数据处理技术领域,包括以下步骤:S1、获取语义数据,并构建语义通信模型;S2、根据语义通信模型,构建时延约束模型和总语义性能指标;S3、根据时延约束模型和总语义性能指标,构建无人机的非线性多约束优化模型;S4、基于非线性多约束优化模型,确定无人机的状态信息、观测信息、动作信息和奖励函数;S5、根据无人机的状态信息、观测信息、动作信息和奖励函数,进行强化学习,完成无人机的通信资源分配与轨迹优化。本发明基于信息素机制,能很好的解决多智能体强化学习算法中存在的稀疏奖励和学习效率的问题,算法能很快收敛并应用。