摘要
本发明公开了一种基于深度强化学习的车联网场景下任务调度方法,属于深度学习技术领域,要解决的技术问题为如何实现车联网场景下任务调度并减少任务调度的完成时间以及能源消耗。包括如下步骤:对于车辆发起的任务,将任务在车辆以及边缘服务器之间的任务调度问题转化为马尔科夫决策问题;基于DQN网络构建调度决策模型,调度决策模型包括结构相同的主网络和目标网络,在动作评估阶段,主网络用于预测输出当前状态每个动作的Q值,在参数优化阶段,主网络用于根据当前状态以及当前状态对应的动作计算Q值,目标网络用于预测下一个状态每个动作的Q值、输出最大Q值;对于马尔科夫决策问题,基于调度决策模型进行动作评估和参数优化。