虚拟人配音图像生成方法、装置、设备及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
虚拟人配音图像生成方法、装置、设备及存储介质
申请号:CN202510471866
申请日期:2025-04-15
公开号:CN120495132A
公开日期:2025-08-15
类型:发明专利
摘要
本发明提供一种虚拟人配音图像生成方法、装置、设备及存储介质,涉及计算机处理技术领域。该方法包括:获取源图像,获取驱动音频以及获取参考图像;对所述源图像、所述驱动音频和所述参考图像进行空间变形处理,生成虚拟人的脸部图像特征;对所述虚拟人的所述脸部图像特征进行修复处理,生成所述虚拟人的配音图像。本发明提供的实施例用以解决现有技术中生成的配音图像质量较差,噪声大的缺陷,实现通过对源图像、驱动音频和参考图像进行空间变形处理和唇部口型修复处理,有效减少生成过程中的模糊现象,提升配音图像的清晰度和细腻度,且进一步提高了音频与口型同步的准确性。
技术关键词
图像生成方法 姿势 音频特征 变形特征 图像生成装置 处理器 模糊现象 计算机程序产品 编码器 网络 存储器 解码器 电子设备 模块 噪声
系统为您推荐了相关专利信息
图像生成模型 图像生成方法 多尺度特征金字塔 变换器 深度图
主轴系统 磨齿机主轴 数据建模方法 蜗杆砂轮 主轴热误差
真实图像数据 生成对抗网络模型 生成图像数据 矩阵 图像生成方法
激光雷达数据 局部特征信息 融合特征 卷积神经网络模型 图像生成方法
分片 字幕 文本 视频 语义标签