一种面向复杂场景的多模态大模型检测识别机器人识别系统
申请号:CN202510917852
申请日期:2025-07-03
公开号:CN120599578A
公开日期:2025-09-05
类型:发明专利
摘要
本申请涉及多模态感知技术领域,公开了一种面向复杂场景的多模态大模型检测识别机器人识别系统,系统构建动态流形建模模块,通过随机微分方程与深度分数匹配实现跨模态联合去噪,利用光流场构建漂移项与各向异性扩散项,消除雨雾、运动模糊等动态噪声干扰;在此基础上,设计信息几何对齐模块,基于黎曼流形优化与正交投影矩阵计算,通过多尺度度量张量融合实现视觉‑Li DAR特征的几何等距映射;进一步提出动态外参标定模块,采用SE(3)流形卡尔曼滤波结合噪声自适应缩放技术,实时跟踪补偿外参偏移量。相较于传统方法,本发明解决了跨模态数据几何失配、外参漂移累积及语义融合低效等核心问题,显著提升了自动驾驶系统在复杂动态场景下的感知精度与鲁棒性。
技术关键词
识别机器人
识别系统
对齐模块
多模态数据采集
动态
联合去噪
卡尔曼滤波补偿
黎曼流形优化
场景
LiDAR点
匹配网络
时间同步误差
交叉注意力机制
光流场
语义特征
度量
惯性里程计
矩阵