一种基于视角特定提示词的三维点云识别方法及相关设备
申请号:CN202510475322
申请日期:2025-04-16
公开号:CN120509381A
公开日期:2025-08-19
类型:发明专利
摘要
本发明公开了一种基于视角特定提示词的三维点云识别方法及相关设备,其中方法包括:获取点云数据,通过多个预设视角对点云进行投影,获得多视角图像;将多视角图像输入对比语言‑图像预训练图像编码器,获得多视图特征;从预设的多源视角特定提示词库中获取视角特定提示词,其中每个视角和一组视角特定提示词对应;将视角特定提示词输入对比语言‑图像预训练文本编码器,获得文本特征;根据多视图特征和文本特征进行相似度计算,根据计算的相似度获取识别结果。本发明通过将点云投影为多视角图像,保留几何信息;为每个视角分配专用提示词,将点云多视角特征与多视角语义特征进行相似度计算,实现零样本或少样本条件下的高精度识别。
技术关键词
三维点云识别方法
文本编码器
图像编码器
多视角
轻量级神经网络
计算机程序产品
物体
预训练模型
大语言模型
指令
贪婪算法
轮廓特征
处理器
生成方式
指标
数据