摘要
本发明公开基于改进POMO算法的组合优化算法,用于解决旅行商问题等组合优化问题中解空间爆炸、传统POMO算法梯度估计方差大、解空间探索不充分及缺乏局部优化能力的问题。方法包括构建带节点间距约束的二维地图;采用含多头自注意力机制的Transformer架构编码器‑解码器模型;通过并行解码复用样本、基于REINFORCE的改进插件引入自适应优势函数减少梯度方差,嵌入含2‑opt优化的进化算法插件及双重缓冲机制优化算法;最终完成TSP路径规划。该算法保持O(n2logn)复杂度,提升了大规模TSP问题求解效率与精度。