摘要
本发明涉及煤矿作业自动化技术领域,具体为基于深度强化学习的煤矿作业机器人导航避障系统。本发明通过激光雷达、红外传感器和摄像头获取煤矿作业机器人周围环境的障碍物信息及变化数据,经卡尔曼滤波数据融合、构建障碍物坐标云图并映射到高清环境照片,能全面、准确地感知周围环境,为后续导航避障提供可靠依据;本发明基于巷道地形图,通过路径规划算法生成多条运动路径,经决策优化选出最优路径,再进行路径差分得到阶段性目标点,可制定出合理的宏观导航策略,确保机器人高效到达目标位置;本发明使用深度Q网络训练机器人,使其能自主决策选择最短避障路径,通过定义网络状态和优化结果、利用Q值奖励函数微调运动路径。