具身智能体多模态感知数据动态融合方法、系统及设备

申请号：CN202510984650

申请日期：2025-07-17

公开号：CN120495828B

公开日期：2025-09-23

类型：发明专利

摘要

本发明公开了一种具身智能体多模态感知数据动态融合方法、系统及设备，包括：S1.具身智能体在运动过程中实时采集图像数据；S2.使用多模态大模型判断图像数据的点云填充密度，数据采集过程中利用地图算法填充相机画面的3D点云；S3.通过点云数据投影转换，生成激光雷达特征图；S4.进行多模态大模型的特征数据初始化对齐；S5.构建一组多尺度多通道可微分的互信息精细优化方法对特征数据进行处理；S6.执行多模态大模型在线监测与融合自矫正操作；S7.将相机信息投影到激光3D点云，在具身智能体的运动过程中持续构建融合后的RGB‑3D场景。本发明能够实现激光雷达与相机之间外参的精准、鲁棒、自动标定和融合。

技术关键词

动态融合方法多模态相机判断图像数据多尺度激光雷达数据采集多通道概率密度函数 3D点云数据处理模块融合激光雷达数据生成图像匹配网络激光雷达点云运动状态信息特征值跨模态