摘要
本申请实施例提供了一种人脸视频生成方法和装置、电子设备及存储介质,属于深度学习技术领域。该方法包括:获取用于驱动目标对象发出的目标语音;对目标语音进行特征提取,得到语音特征;将语音特征输入面部关键点预测模块进行关键点生成,得到多个参考关键点数据;获取目标对象的第一面部关键点数据和第二面部关键点数据;基于第一面部关键点数据对多个参考关键点数据进行数据调整,得到目标面部关键点数据;基于目标面部关键点数据和第二面部关键点数据进行人脸视频生成,得到目标人脸视频。本申请实施例能够在用户提供的视频数据时长较短的情况下,保证生成的目标人脸视频的准确性,同时提高生成目标人脸视频的效率。