视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法

申请号：CN202510829074

申请日期：2025-06-19

公开号：CN120614502A

公开日期：2025-09-09

类型：发明专利

摘要

本申请提供了一种视频生成模型的训练方法、装置、设备、存储介质、程序产品及视频生成方法；包括：获取第一样本数据集；第一样本数据集包括第一驱动音频、第一对象的第一真值视频以及第一掩码视频；第一掩码视频是对第一真值视频中第一对象的脸部部分区域进行掩码后得到的视频；通过待训练的视频生成模型，基于第一驱动音频，对第一真值视频和第一掩码视频进行语音驱动，得到第一驱动视频；基于第一驱动音频、第一驱动视频和第一真值视频进行判别损失计算，得到视频生成模型的判别损失结果；基于判别损失结果，对视频生成模型的模型参数进行更新，得到训练后的视频生成模型。通过本申请，能够提升视频生成模型的视频生成效果。

技术关键词

视频生成模型视频生成方法计算机可执行指令图像视觉特征提取语义特征提取语音对象计算机程序产品音频特征样本可读存储介质解码模块编码模块