一种基于非标定单视图的三维目标重建方法

申请号：CN202410917490

申请日期：2024-07-10

公开号：CN118470221B

公开日期：2024-09-03

类型：发明专利

摘要

本发明公开了一种基于非标定单视图的三维目标重建方法，属于计算机视觉领域。首先通过SAM模型从图像中有效的从背景中分割出物体数据，将这些物体数据作为训练的图像数据；然后通过多模态大模型CLIP的图像编码器进行编码，获得图像特征数据；随后基于高斯模型先后进行粗粒度和细粒度的物体点云生成；然后把生成的点云分成点云簇，传入一个点云特征编码器生成点特征，再基于交叉注意力机制，对图像特征和点云特征进行两阶段的融合；最后结合融合特征对密集点云的细节恢复与真实点云基于倒角距离的损失函数去进行模型参数学习进而对物体点云重建。经过实际验证，本发明提供的目标重建方法具有高效、精度高的特点。

技术关键词

图像编码器物体交叉注意力机制图像特征信息点云特征三维点云信息二维图像信息多模态噪声图像特征数据原始图像数据代表参数计算机视觉