摘要
本发明提供一种虚拟人配音图像生成方法、装置、设备及存储介质,涉及计算机处理技术领域。该方法包括:获取源图像,获取驱动音频以及获取参考图像;对所述源图像、所述驱动音频和所述参考图像进行空间变形处理,生成虚拟人的脸部图像特征;对所述虚拟人的所述脸部图像特征进行修复处理,生成所述虚拟人的配音图像。本发明提供的实施例用以解决现有技术中生成的配音图像质量较差,噪声大的缺陷,实现通过对源图像、驱动音频和参考图像进行空间变形处理和唇部口型修复处理,有效减少生成过程中的模糊现象,提升配音图像的清晰度和细腻度,且进一步提高了音频与口型同步的准确性。