摘要
本发明提供基于TD3算法的未知环境下无人机通信路径规划方法,属于人工智能辅助无线通信领域,包括:步骤S1、构建UAV在未知环境进行路径规划的系统模型和优化问题,以最小化任务完成时间并避免障碍物为目标;步骤S2、基于步骤S1所构建的系统模型,将优化问题建模为马尔可夫决策过程;步骤S3、基于步骤S1所构建的系统模型和步骤S2所构建的马尔可夫决策过程,设计基于TD3算法的路径规划框架,使用梯度下降法更新Actor网络、Critic1网络、Critic2网络,以软更新方式更新目标Actor网络、目标Critic1网络和目标Critic2网络参数,以完成通信路径规划。本发明能够最小化为所有GU提供通信服务的时间,并有效避免碰撞,有效提升性能。