摘要
一种基于前向传播的高斯点云重建的立体头部模型生成方法,在生成多视角图像阶段:将输入图像压缩到潜在空间得到潜在状态同时提取输入图像的身份信息,通过带有空间和时间注意力模块的去噪U‑Net进行去噪并通过VAE解码器生成多视角图像,用于训练权重微调网络;在高斯重建阶段:计算视频扩散模型生成的多视角图像中的每个像素所在相机的世界坐标原点以及光线方向,将多视角图像、通过计算得到对应的光线嵌入以及光线方向在通道维度上进行拼接,形成网络输入特征,利用基于LGM网络改进的非对称高斯生成UNet,根据视频扩散模型生成的多视角图像,生成特征图后,对该特征图进行通道扁平化处理得到高斯点云。本发明能生成更生动逼真、高质量的3D头部模型。