摘要
本发明公开了一种扫地机器人动态路径规划方法,通过传感器获取环境信息,利用运动模型预测动态障碍物未来的位置,定义机器人的动作空间为速度控制空间,计算改进的人工势场,包括引力场和斥力场,通过定义预测碰撞窗口,构建强化学习模型,设计奖励函数,强化学习模型网络集成到扫地机器人。解决了传统人工势场法易陷入局部极小值的问题,提高了对动态障碍物的预测和避障能力,使用强化学习优化DWA算法的评价函数,使其更具适应性和智能性,能够更好地处理动态环境,强化学习可以学习环境的全局信息,并将这些信息融入到局部路径规划中,从而避免陷入局部最优解,能迅速调整路线,确保可高效覆盖全部清洁区域,有效提升清洁效率和能源利用率。