摘要
本发明公开了一种基于融合专家网络与深度强化学习的智能流量编排方法,包括实时采集网络节点与链路状态数据,构建时序输入向量和拓扑图结构;使用时序神经网络和图神经网络分别提取流量时空特征与节点拓扑特征,融合后通过分类网络预测未来流量,并完成至不同服务等级网络切片的粗粒度编排;将资源调度建模为多智能体马尔可夫决策过程,设计状态空间、动作空间和奖励函数;初始化深度强化学习智能体,通过交互经验进行训练;融合预训练的专家策略网络,构建总损失函数以优化网络参数;最终生成能够根据实时状态动态优化流量路径与资源分配的智能策略;本发明能够实现多业务差异化服务质量需求下的高效资源调度。