摘要
本发明公开了一种多视角语义建模与定位方法及系统,其中方法包括,将目标所在地图划分为多个连续的节点,通过多视角视觉传感器采集各节点的图像和三维信息;对各节点图像提取特征,包括通过改进MAMBA模型提取的语义卷积特征,以及通过构建图像语义拓扑矩阵Q提取的语义拓扑特征;对待测图像提取多类特征;引入参数梯度K(m)进行动态加权融合;通过图像二维‑三维坐标的对应关系解算待测图像的初始位姿;结合匹配图像语义特征的三维坐标进行位姿优化;进行当前帧目标位姿预测,并通过多视角的第二视角当前帧图像获取的位姿修正预测结果。本发明采用了结合时序预测的多视角感知与多特征提取技术,能有效提高目标位姿解算的精确度与稳定性。