融合语言-视觉多模态感知的IMU辅助深度SLAM方法及系统
申请号:CN202510745338
申请日期:2025-06-05
公开号:CN120628058A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提供一种融合语言‑视觉多模态感知的IMU辅助深度SLAM方法及系统,包括初始校准与语义地图初始化、预积分预测与关键帧判定、稠密点云重建与相对位姿估计、语义嵌入提取、语义引导回环检测及语义三维地图增量更新等功能模块,通过图优化框架将IMU运动先验、深度几何约束与语言模型语义因子联合建模,实现复杂动态环境下的高精度定位与带标签地图构建。相较于仅依赖几何或惯性信息的现有技术,本发明降低了回环误匹配率,提升了闭环收敛效率和长时重定位鲁棒性,并为自然语言导航、目标检索等上层任务提供语义接口。本发明可广泛应用于服务机器人、安防巡检、智能驾驶及灾后搜索救援等领域。
技术关键词
关键帧
SLAM方法
稠密点云
语义向量
多模态
语义数据库
深度相机
语义地图
代表
语义特征
深度图
点云配准方法
时间同步机制
图像块
视觉特征
预测机器人
融合特征