一种基于深度估计和扩散模型的新视角图像生成的方法

申请号：CN202510369935

申请日期：2025-03-27

公开号：CN120219633A

公开日期：2025-06-27

类型：发明专利

摘要

本发明公开一种基于深度估计和扩散模型的新视角图像生成的方法。本发明首先生成训练数据集，并利用其预训练图像内容填充模型和深度补全模型；利用单目深度估计模型估计输入图像的单目深度，构建其网格表示，并渲染新视角带有掩码的图像和深度；利用预训练的图像内容填充模型和深度补全模型，填充新视角带有掩码的图像和深度中的掩码内容。通过结合深度估计和扩散模型，本发明方法能更准确地估计深度，从而在生成新视角图像时提供更高的3D结构质量和细节。本发明方法能够处理更广泛的视角变换，突破了现有技术只能处理有限小视角变换的限制。

技术关键词

单目深度估计生成训练数据网格模型深度图视角三维渲染技术图像生成系统模型预训练坐标标识像素场景相机文本纹理运动模块标签