基于多线程异步深度强化学习的移动机器人自主避障方法

申请号：CN202510695245

申请日期：2025-05-28

公开号：CN120686812A

公开日期：2025-09-23

类型：发明专利

摘要

本申请公开基于多线程异步深度强化学习的移动机器人自主避障方法，具体包括：在PPO算法基础上加入多任务异步并行机制，构建MAPPO，将不同避障任务场景分离并同时训练；基于nokov‑lidar多传感器感知信息，构建机器人环境状态观测空间；基于全局网格世界导航地图，设计离散化动作空间，并为状态更新设置运动学约束；设计导航奖励函数，引导移动机器人在复杂环境中做出最佳避障决策；基于多层感知机构建过早碰撞预测模块，推断来自可感知环境的碰撞信息，并联合MAPPO学习训练出最优避障策略。本发明可实现充分的移动机器人‑环境交互，提高机器人动作决策模型的探索能力，保证其在向目标移动过程的实时避障。

技术关键词

深度强化学习移动机器人多线程传感器感知信息状态更新多层感知机策略多任务决策梯度下降算法速度估计算法模块多标签机制激光雷达