摘要
本发明涉及强化学习技术领域,提供了一种基于强化学习的扫地机器人控制系统,该系统包括环境感知模块、机器人控制模块和动作执行模块;环境感知模块采用多传感器联合定位算法融合激光雷达、IMU和视觉传感器的数据,实时估算扫地机器人的运动状态;机器人控制模块采用稳定目标引导深度Q学习技术生成最优控制策略,使机器人能够自适应地调整清扫路径、避障策略和操作模式;通过本发明的技术方案,不仅提高了机器人在复杂环境中的定位精度,还增强了其对环境变化的适应能力,提升了整体工作效率和智能化水平;该系统能够为用户提供更加稳定、精准且高效的扫地机器人解决方案。