基于时序状态感知的深度强化学习车辆边缘计算卸载方法及相关设备

申请号：CN202411526108

申请日期：2024-10-29

公开号：CN119597416A

公开日期：2025-03-11

类型：发明专利

摘要

本发明提供一种基于时序状态感知的深度强化学习车辆边缘计算卸载方法及相关设备。该方法通过将LSTM网络嵌套在DDPG网络的actor网络和critic网络的前馈神经网络中，构建得到深度强化学习网络；接着定义深度强化学习网络的状态空间、动作空间和奖励函数，进而使用经验缓冲区中的样本数据对深度强化学习网络进行训练，得到车辆边缘计算卸载模型。其中，在定义状态空间时，根据车辆属性和任务大小对车辆赋予了优先级数值，解决了在车辆边缘环境中面临的时延敏感性问题；而通过使用LSTM网络分析车辆的历史状态和当前状态，捕获历史状态和当前状态之间的时间依赖关系，实现对车辆状态变化的感知，提高动作预测的准确性，更好地预测动作，降低系统成本。

技术关键词

深度强化学习卸载方法车辆前馈神经网络时序空间模块非暂态计算机可读存储介质定义时延布尔型变量队列资源分配样本服务器坐标卸载系统数值网络分析