融合语言-视觉多模态感知的IMU辅助深度SLAM方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
融合语言-视觉多模态感知的IMU辅助深度SLAM方法及系统
申请号:CN202510745338
申请日期:2025-06-05
公开号:CN120628058A
公开日期:2025-09-12
类型:发明专利
摘要
本发明提供一种融合语言‑视觉多模态感知的IMU辅助深度SLAM方法及系统,包括初始校准与语义地图初始化、预积分预测与关键帧判定、稠密点云重建与相对位姿估计、语义嵌入提取、语义引导回环检测及语义三维地图增量更新等功能模块,通过图优化框架将IMU运动先验、深度几何约束与语言模型语义因子联合建模,实现复杂动态环境下的高精度定位与带标签地图构建。相较于仅依赖几何或惯性信息的现有技术,本发明降低了回环误匹配率,提升了闭环收敛效率和长时重定位鲁棒性,并为自然语言导航、目标检索等上层任务提供语义接口。本发明可广泛应用于服务机器人、安防巡检、智能驾驶及灾后搜索救援等领域。
技术关键词
关键帧 SLAM方法 稠密点云 语义向量 多模态 语义数据库 深度相机 语义地图 代表 语义特征 深度图 点云配准方法 时间同步机制 图像块 视觉特征 预测机器人 融合特征