未知环境下智能体多尺度前沿感知强化学习区域覆盖方法
申请号:CN202510686021
申请日期:2025-05-27
公开号:CN120802929A
公开日期:2025-10-17
类型:发明专利
摘要
本发明提供一种未知环境下智能体多尺度前沿感知强化学习区域覆盖方法,构建多个以智能体所处位置为中心,尺寸增大,分辨率降低的智能体局部邻域形成观测空间的多尺度地图,每个观测尺度都包含了障碍物信息和覆盖区域信息,便于智能体进行长期规划和局部规划。采用自注意力特征融合机制,充分提取和利用多尺度地图与传感器包含的地图特征信息,使得智能体更关注未覆盖区域的前沿和覆盖过程中的空洞。构建未知前沿奖励,进一步解决覆盖过程中的空洞问题。使用强化学习方法,结合其他多种奖励,通过课程学习训练智能体使其完成对未知环境的区域覆盖,提高对多种环境的泛化性。
技术关键词
区域覆盖方法
障碍物
多尺度地图
地图特征
网络
特征提取模块
多头注意力机制
特征提取单元
课程学习方法
策略
强化学习方法
训练智能
信号
覆盖率
参数
传播算法
空洞
像素
激光雷达