一种基于非标定单视图的三维目标重建方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于非标定单视图的三维目标重建方法
申请号:CN202410917490
申请日期:2024-07-10
公开号:CN118470221B
公开日期:2024-09-03
类型:发明专利
摘要
本发明公开了一种基于非标定单视图的三维目标重建方法,属于计算机视觉领域。首先通过SAM模型从图像中有效的从背景中分割出物体数据,将这些物体数据作为训练的图像数据;然后通过多模态大模型CLIP的图像编码器进行编码,获得图像特征数据;随后基于高斯模型先后进行粗粒度和细粒度的物体点云生成;然后把生成的点云分成点云簇,传入一个点云特征编码器生成点特征,再基于交叉注意力机制,对图像特征和点云特征进行两阶段的融合;最后结合融合特征对密集点云的细节恢复与真实点云基于倒角距离的损失函数去进行模型参数学习进而对物体点云重建。经过实际验证,本发明提供的目标重建方法具有高效、精度高的特点。
技术关键词
图像编码器 物体 交叉注意力机制 图像特征信息 点云特征 三维点云信息 二维图像信息 多模态 噪声 图像特征数据 原始图像数据 代表 参数 计算机视觉