面向复杂开放场景的三维语义分割方法

申请号：CN202410997936

申请日期：2024-07-24

公开号：CN118968060B

公开日期：2025-07-08

类型：发明专利

摘要

本发明公开一种面向复杂开放场景的三维语义分割方法，其包括预训练阶段和推理阶段，在预训练阶段包括以下步骤：在预训练阶段，采集原始场景中的物体点云、文本词汇、二维图像以及场景点云，从物体点云、文本词汇、二维图像以及三维场景点云中提取特征；在多模态数据特征之间进行对齐，并通过对比学习进行知识蒸馏获得鲁棒的三维特征表达器；在推理阶段包括以下步骤：对“提示”和三维场景点云进行特征提取；将三维场景点云特征与提示特征进行相似度计算，相似度值大于设定阈值的三维点即为选定区域。本发明以物体点云、文本词汇、二维图像作为提示，从复杂三维场景中分割出对应区域，同时还具备对整个三维场景进行闭集语义分割的能力。

技术关键词

三维语义分割方法点云特征提取三维特征提取场景图像语义分割模型文本编码器特征提取器物体特征提取阶段图像像素模型预训练相机旋转样本点云模型