摘要
本发明涉及一种基于多智能体强化学习的高自由度机械臂路径规划方法,至少包括环境感知、多智能体建模、注意力机制融合、协同强化学习、多维奖励评估与路径执行六大模块;通过图神经网络对机械臂关节建模,刻画拓扑结构;融合通道与空间注意力机制增强特征表达;采用集中训练与分布执行的多智能体提升策略优化效率;引入动态加权的多维奖励函数综合考虑路径长度、避障安全、关节平滑性和能耗。最终生成路径序列部署至控制器,保障轨迹跟踪与避障性能。结果表明,本发明在路径规划精度、收敛效率与避障性能等方面均优于现有方法,具有良好的工程适应性与推广价值。