一种基于强化学习的TSP路径组合优化方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于强化学习的TSP路径组合优化方法及系统
申请号:CN202510016231
申请日期:2025-01-06
公开号:CN119939107A
公开日期:2025-05-06
类型:发明专利
摘要
本发明提出一种基于强化学习的TSP路径组合优化方法及系统,通过将解分布学习与组合优化目标学习相结合,构建了一种各向异性的图神经网络作为扩散模型的骨干网络,利用其表示能力捕捉图结构数据中的复杂关系,利用扩散模型单转马尔可夫前向过程建模概率分布。此外,本发明还引入了两种扩散模型的加速采样方法DDIM和DPM‑solver,加速去噪的采样过程,提高训练效率。本发明能够通过将直接偏好优化引入到扩散模型中进而提出偏好引导组合优化((Preference‑GuidedCombinatorial Optimization,PGCO),提高求解旅行商问题(TSP)模型的泛化能力和适应性,提供了一个更高效、高质量的求解大规模组合优化的模型。
技术关键词
组合优化方法 条件协方差矩阵 微分方程求解器 ODE求解器 噪声预测模型 定义 神经网络参数 噪声解 噪声强度 噪声系数 卷积特征 采样方法 随机噪声 节点数 分阶段 超参数 注意力