摘要
本发明公开一种异构网络中基于深度强化学习的自适应多路径调度方法,包括在链路管理模块中,引入多路径传输增益模型,用于量化多条链路在聚合带宽提升与端到端时延增加之间的权衡关系,通过筛选性能较好且差异较小的链路集合,有效降低了低性能链路对系统传输性能的负面影响;在深度强化学习模块中,通过结合优先经验回放和异步学习机制,提升模型对不稳定环境的适应性、学习效率和决策准确性,通过动态调整数据包分配策略和传输顺序,实现网络吞吐量与重排序时延之间的优化平衡。本发明采用异步优先重放双深度Q学习算法,能够在动态网络环境中实现链路状态的实时感知以及数据包的决策调度,显著提升网络的聚合吞吐量,并且有效降低传输时延。