面向复杂开放场景的三维语义分割方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
面向复杂开放场景的三维语义分割方法
申请号:CN202410997936
申请日期:2024-07-24
公开号:CN118968060B
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开一种面向复杂开放场景的三维语义分割方法,其包括预训练阶段和推理阶段,在预训练阶段包括以下步骤:在预训练阶段,采集原始场景中的物体点云、文本词汇、二维图像以及场景点云,从物体点云、文本词汇、二维图像以及三维场景点云中提取特征;在多模态数据特征之间进行对齐,并通过对比学习进行知识蒸馏获得鲁棒的三维特征表达器;在推理阶段包括以下步骤:对“提示”和三维场景点云进行特征提取;将三维场景点云特征与提示特征进行相似度计算,相似度值大于设定阈值的三维点即为选定区域。本发明以物体点云、文本词汇、二维图像作为提示,从复杂三维场景中分割出对应区域,同时还具备对整个三维场景进行闭集语义分割的能力。
技术关键词
三维语义分割方法 点云特征提取 三维特征提取 场景 图像语义分割模型 文本编码器 特征提取器 物体特征提取 阶段 图像像素 模型预训练 相机旋转 样本 点云模型