一种基于视角特定提示词的三维点云识别方法及相关设备

申请号：CN202510475322

申请日期：2025-04-16

公开号：CN120509381A

公开日期：2025-08-19

类型：发明专利

摘要

本发明公开了一种基于视角特定提示词的三维点云识别方法及相关设备，其中方法包括：获取点云数据，通过多个预设视角对点云进行投影，获得多视角图像；将多视角图像输入对比语言‑图像预训练图像编码器，获得多视图特征；从预设的多源视角特定提示词库中获取视角特定提示词，其中每个视角和一组视角特定提示词对应；将视角特定提示词输入对比语言‑图像预训练文本编码器，获得文本特征；根据多视图特征和文本特征进行相似度计算，根据计算的相似度获取识别结果。本发明通过将点云投影为多视角图像，保留几何信息；为每个视角分配专用提示词，将点云多视角特征与多视角语义特征进行相似度计算，实现零样本或少样本条件下的高精度识别。

技术关键词

三维点云识别方法文本编码器图像编码器多视角轻量级神经网络计算机程序产品物体预训练模型大语言模型指令贪婪算法轮廓特征处理器生成方式指标数据