一种基于多模态语义融合的智能图像数据标注方法及系统

申请号：CN202510688288

申请日期：2025-05-27

公开号：CN120544164A

公开日期：2025-08-26

类型：发明专利

摘要

本发明适用于图像标注及智能交通技术领域，提供了一种基于多模态语义融合的智能图像数据标注方法及系统，该方法包括以下步骤：获取同一时空的图像数据、点云数据、语音数据以及环境信息；对图像数据进行语义分割，得到图像分割信息；将点云数据与图像数据进行对齐处理，生成与图像像素对齐的3D点云；根据3D点云，推断被遮挡目标的几何轮廓，得到点云几何信息；结合环境信息，将图像分割信息与点云几何信息进行融合，得到图像融合信息；结合语音数据，根据图像融合信息对图像数据中的可见目标以及被遮挡目标进行带有行为语义的标注。本发明通过融合图像、语音和点云等多模态数据，可以准确对复杂场景中被遮挡目标进行语义标注。

技术关键词

图像融合信息图像分割信息数据标注方法数据标注系统多模态图像像素语音 3D点云数据对齐模块语义向量深度学习模型坐标系聚类矩阵轮廓智能交通技术

系统为您推荐了相关专利信息

一种多模态肛肠检测探头

温控传感器检测探头气囊线缆管道导电凝胶

基于人工智能的数据流优化方法及系统

数据流优化方法数字孪生模型动态拓扑结构多模态特征决策

一种多模态语义感知与强化学习的自平衡独轮车控制系统及方法

平衡独轮车反作用飞轮强化学习策略多模态驱动轮电机

双相障碍群体的确定方法、装置及设备

脑电特征双相障碍语音特征面部图像数据融合特征

一种基于多模态分析鉴别云南普洱茶产地及品种的方法

挥发性香气物质顶空固相微萃取全二维气相色谱飞行时间质谱技术云南普洱茶