摘要
本发明公开了一种几何和姿态感知的文本生成三维对象方法及系统,包括以下步骤:将文本输入三维扩散生成模型获得粗糙三维对象,利用粗糙三维对象初创化目标三维对象;将目标三维对象通过渲染获得法向贴图;利用粗糙三维对象初创化目标三维对象,并将目标三维对象在的相机参数下渲染获得法向贴图,将法向贴图输入图片编码器得到图片特征向量;将输入文本与方位词合并在一起,通过文本编码器得到文本特征向量;将相机参数通过多层感知器编码得到相机特征;将图片特征向量、文本特征向量、相机特征输入到拓扑感知扩散模型中获得预测的高斯噪声计算分数蒸馏采样损失函数和低频法向平滑损失函数并进行梯度反传,迭代更新三维对象,获得最终三维对象。