摘要
本发明涉及一种面向星地融合网络的时延优化计算卸载策略,包括以下步骤:步骤1、构建星地融合网络系统模型,所述系统模型包括网络模型、星地链路通信模型、队列模型、本地设备计算模型、LEO卫星计算模型和地面云计算中心计算模型,并进行问题描述;步骤2、基于李雅普诺夫稳定性理论,将长期混合整数非线性规划优化问题解耦为各时隙的子优化问题;步骤3、先把各时隙计算卸载问题转化为马尔可夫决策过程,用深度强化学习算法求解;接着设计Actor模块的双策略网络模型结构以生成策略;最后用三元保序量化器探索更优卸载策略,加速模型收敛。本发明能够实现对终端与低轨卫星任务队列的动态调控,提升卸载过程的长期稳定性与计算资源的持续可用性。