摘要
本发明公开了一种基于强化学习的边缘计算资源分配优化方法及系统,涉及边缘计算资源管理技术领域,包括采集计算负载数据和网络状态数据,形成历史负载序列,构建状态空间矩阵,并将历史负载序列映射为离散状态值,建立深度神经网络模型;将状态空间矩阵输入深度神经网络模型,根据计算任务的优先级和时延要求,生成资源分配策略集;采用双重Q学习算法对资源分配策略集进行迭代训练,基于任务完成时间和资源利用率设定奖励函数,选择最优资源分配策略;按照最优资源分配策略调整边缘节点的计算资源分配,同时将执行结果反馈至深度神经网络模型用于在线学习更新。本发明通过引入深度强化学习方法,实现边缘计算资源分配的智能化优化。