一种基于深度强化学习的动态缓冲区大小调整方法

申请号：CN202510081574

申请日期：2025-01-20

公开号：CN119520450B

公开日期：2025-06-24

类型：发明专利

摘要

本发明公开了一种基于深度强化学习的动态缓冲区大小调整方法，包括：构建Dueling DQN模型和经验回放池，将网络状态依次经过两层全连接层提取特征，通过自注意力机制进行注意力权重分配，再经过噪声层引入噪声扰动；采用动作优势网络对智能体所能采取的动作进行评估，采用状态价值网络对网络状态进行评估，获得网络的Q值并执行动作，基于反馈的奖励以及下一时刻网络状态，构成网络环境样本存入经验回放池中；抽取网络环境样本训练Dueling DQN模型；本发明所设计的方法通过强化学习算法，在不同流量负载和网络状态下，动态调整缓冲区大小减少抖动和延迟，从而有效提高网络的传输性能，提升服务质量。

技术关键词

深度强化学习网络状态映射样本噪声注意力机制动态权重分配强化学习算法参数策略更新矩阵传播算法定义时延队列误差数据