摘要
本发明公开一种面向复杂开放场景的三维语义分割方法,其包括预训练阶段和推理阶段,在预训练阶段包括以下步骤:在预训练阶段,采集原始场景中的物体点云、文本词汇、二维图像以及场景点云,从物体点云、文本词汇、二维图像以及三维场景点云中提取特征;在多模态数据特征之间进行对齐,并通过对比学习进行知识蒸馏获得鲁棒的三维特征表达器;在推理阶段包括以下步骤:对“提示”和三维场景点云进行特征提取;将三维场景点云特征与提示特征进行相似度计算,相似度值大于设定阈值的三维点即为选定区域。本发明以物体点云、文本词汇、二维图像作为提示,从复杂三维场景中分割出对应区域,同时还具备对整个三维场景进行闭集语义分割的能力。