摘要
本发明公开了一种节能无线算力网络资源管理方法和装置,涉及通信技术领域,方法包括:以无线算力网络的计算节点间互传为基础,基于无线算力网络的任务模型、计算模型、通信模型和队列模型,以最小化网络总能耗为目标构建任务资源联合优化问题;将任务资源联合优化问题转化为马尔可夫决策过程并对应构建待训练的深度强化学习模型,以奖励值最大化为目标对待训练的深度强化学习模型迭代训练,确定训练好的深度强化学习模型;当无线算力网络接收到待处理计算任务时,通过训练好的深度强化学习模型输出待处理计算任务的目标任务卸载决策。基于上述方案,有助于确保无线算力网络在任务卸载和资源调度决策能够在稳定性和能效之间找到平衡。