人脸视频生成方法和装置、电子设备及存储介质

申请号：CN202411090654

申请日期：2024-08-09

公开号：CN119181373A

公开日期：2024-12-24

类型：发明专利

摘要

本申请实施例提供了一种人脸视频生成方法和装置、电子设备及存储介质，属于深度学习技术领域。该方法包括：获取用于驱动目标对象发出的目标语音；对目标语音进行特征提取，得到语音特征；将语音特征输入面部关键点预测模块进行关键点生成，得到多个参考关键点数据；获取目标对象的第一面部关键点数据和第二面部关键点数据；基于第一面部关键点数据对多个参考关键点数据进行数据调整，得到目标面部关键点数据；基于目标面部关键点数据和第二面部关键点数据进行人脸视频生成，得到目标人脸视频。本申请实施例能够在用户提供的视频数据时长较短的情况下，保证生成的目标人脸视频的准确性，同时提高生成目标人脸视频的效率。

技术关键词

面部关键点语音特征数据视频生成方法人脸对象面部图像视频生成装置视频帧情感特征情感分类模型解码模块电子设备图像生成器深度学习技术