视频生成方法、视频生成模型的训练方法和相关装置

申请号：CN202510345066

申请日期：2025-03-21

公开号：CN120236230A

公开日期：2025-07-01

类型：发明专利

摘要

本申请实施例公开了一种视频生成方法、视频生成模型的训练方法和相关装置。主要技术方案包括：获取人脸图像和视频描述文本；所述人脸图像包括目标人脸；从所述人脸图像中提取所述目标人脸的二维特征和三维特征；将所述目标人脸的二维特征和三维特征进行融合，得到所述目标人脸的身份特征表示；基于所述身份特征表示和所述视频描述文本，预测得到包含所述目标人脸的目标视频。本申请能够有效捕捉目标人脸的多维度特征，从而生成更加真实和自然的目标视频。

技术关键词

视频生成模型人脸身份视频生成方法文本噪声图像变换器模块损失函数取值顶点网络生成调制信号视频生成装置坐标多头注意力机制融合特征样本特征提取单元计算机程序产品