摘要
基于多智能体深度强化学习的多模式路由优化方法,属于边缘计算与网络路由领域,包括:构建多模式路由架构,并设计多模式路由节点交互机制;构建多智能体的状态空间、动作空间、空间状态转移概率和奖励函数;设计双层语义自注意力机制;构建并训练增强型多智能体深度强化学习模型;设计智能体运行协议动态切换的触发条件;设计模型性能评估函数与超参数调优策略。本发明通过设计具有可切换工作模式的路由节点,使其能根据网络状态动态选择路由协议;利用集中式训练与分布式执行框架,结合本地和全局价值网络实现多智能体的协同优化;引入双层语义自注意力机制提升对异构网络状态的解析能力,保证路由可靠性,提高网络吞吐量、降低传输时延。