摘要
一种低轨卫星网络中基于DDRL的航空器任务卸载方法,其步骤包括:(一)把LEO低轨卫星网络系统构建成LEO卫星移动边缘计算网络系统;(二)把LEO低轨卫星网络系统效用最大化问题建模为一个优化任务卸载和资源分配的联合决策问题;(三)把联合决策问题转化为马尔可夫决策过程MDP,在双深度强化学习DDRL框架下,利用双重深度Q网络算法DDQN学习最优的任务卸载决策,并在此基础上使用时间差分三重策略梯度算法TD3PG以获得最优资源分配策略。仿真实验表明,该方案与基准算法相比,能够有效地访问和协同计算并发任务,并且在不同的环境变量下具有更好的收敛性和优越性。