虚拟人配音图像生成方法、装置、设备及存储介质

申请号：CN202510471866

申请日期：2025-04-15

公开号：CN120495132A

公开日期：2025-08-15

类型：发明专利

摘要

本发明提供一种虚拟人配音图像生成方法、装置、设备及存储介质，涉及计算机处理技术领域。该方法包括：获取源图像，获取驱动音频以及获取参考图像；对所述源图像、所述驱动音频和所述参考图像进行空间变形处理，生成虚拟人的脸部图像特征；对所述虚拟人的所述脸部图像特征进行修复处理，生成所述虚拟人的配音图像。本发明提供的实施例用以解决现有技术中生成的配音图像质量较差，噪声大的缺陷，实现通过对源图像、驱动音频和参考图像进行空间变形处理和唇部口型修复处理，有效减少生成过程中的模糊现象，提升配音图像的清晰度和细腻度，且进一步提高了音频与口型同步的准确性。

技术关键词

图像生成方法姿势音频特征变形特征图像生成装置处理器模糊现象计算机程序产品编码器网络存储器解码器电子设备模块噪声

系统为您推荐了相关专利信息

基于分层深度感知变换器的图像生成方法及其相关设备

图像生成模型图像生成方法多尺度特征金字塔变换器深度图

一种考虑电-机-热耦合效应的蜗杆砂轮磨齿机主轴热误差机理-数据建模方法

主轴系统磨齿机主轴数据建模方法蜗杆砂轮主轴热误差

基于差分矩阵的生成对抗网络的图像生成方法

真实图像数据生成对抗网络模型生成图像数据矩阵图像生成方法

一种图像生成方法、装置、电子设备及存储介质

激光雷达数据局部特征信息融合特征卷积神经网络模型图像生成方法

一种长视频结构化标签生成方法及系统

分片字幕文本视频语义标签