摘要
本发明公开了一种基于深度强化学习的动态缓冲区大小调整方法,包括:构建Dueling DQN模型和经验回放池,将网络状态依次经过两层全连接层提取特征,通过自注意力机制进行注意力权重分配,再经过噪声层引入噪声扰动;采用动作优势网络对智能体所能采取的动作进行评估,采用状态价值网络对网络状态进行评估,获得网络的Q值并执行动作,基于反馈的奖励以及下一时刻网络状态,构成网络环境样本存入经验回放池中;抽取网络环境样本训练Dueling DQN模型;本发明所设计的方法通过强化学习算法,在不同流量负载和网络状态下,动态调整缓冲区大小减少抖动和延迟,从而有效提高网络的传输性能,提升服务质量。