融合语言-视觉多模态感知的IMU辅助深度SLAM方法及系统

申请号：CN202510745338

申请日期：2025-06-05

公开号：CN120628058A

公开日期：2025-09-12

类型：发明专利

摘要

本发明提供一种融合语言‑视觉多模态感知的IMU辅助深度SLAM方法及系统，包括初始校准与语义地图初始化、预积分预测与关键帧判定、稠密点云重建与相对位姿估计、语义嵌入提取、语义引导回环检测及语义三维地图增量更新等功能模块，通过图优化框架将IMU运动先验、深度几何约束与语言模型语义因子联合建模，实现复杂动态环境下的高精度定位与带标签地图构建。相较于仅依赖几何或惯性信息的现有技术，本发明降低了回环误匹配率，提升了闭环收敛效率和长时重定位鲁棒性，并为自然语言导航、目标检索等上层任务提供语义接口。本发明可广泛应用于服务机器人、安防巡检、智能驾驶及灾后搜索救援等领域。

技术关键词

关键帧 SLAM方法稠密点云语义向量多模态语义数据库深度相机语义地图代表语义特征深度图点云配准方法时间同步机制图像块视觉特征预测机器人融合特征