一种基于多维信息和强化学习的动态分组路由算法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于多维信息和强化学习的动态分组路由算法
申请号:CN202410937004
申请日期:2024-07-12
公开号:CN118972309A
公开日期:2024-11-15
类型:发明专利
摘要
本发明公开了一种基于多维信息和强化学习的动态分组路由算法,属于路由网络技术领域。针对如何确定机器学习算法中网络状态与路由动作的映射关系,如何设计在线优化算法策略,并最大化算法收益问题,通过基于马尔可夫过程对路由过程进行建模;基于Double DQN算法框架并采用DNN网络构建评论网络Q(·)、目标评论网络Q‑(·);利用深度学习网络对建立的模型进行更新训练与强化学习,寻找出最佳的路由分组策略。本发明将每个路由器节点抽象为独立的智能体,以数据包当前位置节点、网络中节点数量、当前位置节点数据包接收长度、邻居节点集合等多维数据作为神经网络的输入,并结合分段奖励函数来确定路由最佳动作,最终实现路由过程的效率最大化。
技术关键词
节点 算法框架 深度学习网络 最大化算法 邻居 表达式 队列 动态 机器学习算法 决策 策略 网络技术 路由器 参数 索引 分段 在线 因子