一种几何和姿态感知的文本生成三维对象方法及系统

申请号：CN202510419997

申请日期：2025-04-03

公开号：CN120526036A

公开日期：2025-08-22

类型：发明专利

摘要

本发明公开了一种几何和姿态感知的文本生成三维对象方法及系统，包括以下步骤：将文本输入三维扩散生成模型获得粗糙三维对象，利用粗糙三维对象初创化目标三维对象；将目标三维对象通过渲染获得法向贴图；利用粗糙三维对象初创化目标三维对象，并将目标三维对象在的相机参数下渲染获得法向贴图，将法向贴图输入图片编码器得到图片特征向量；将输入文本与方位词合并在一起，通过文本编码器得到文本特征向量；将相机参数通过多层感知器编码得到相机特征；将图片特征向量、文本特征向量、相机特征输入到拓扑感知扩散模型中获得预测的高斯噪声计算分数蒸馏采样损失函数和低频法向平滑损失函数并进行梯度反传，迭代更新三维对象，获得最终三维对象。

技术关键词

生成三维对象文本特征向量法线贴图相机文本编码器多层感知器蒸馏图片神经网络架构参数高斯滤波器预训练模型噪声样本模块网络结构