摘要
本公开涉及视频处理技术领域,公开了视频生成方法、装置、设备、存储介质及程序产品,该方法包括:获取目标音频、待处理视频以及目标对象的多张图像,待处理视频是对目标对象的视频中的唇部区域进行掩模处理得到的;基于目标音频生成目标对象的驱动关键点;基于多张图像中唇部区域的牙齿图像质量,对多张图像进行筛选,确定参考图像;对参考图像中的目标对象进行关键点提取,得到参考关键点;基于参考图像、参考关键点以及驱动关键点,对待处理视频中的唇部区域进行预测,确定与目标音频对应的目标视频。本公开能够解决语音驱动唇形的驱动效果较差的问题,以提高语音驱动唇形所生成的说话视频的视频质量。