视频生成模型训练方法、装置、设备、介质和产品

申请号：CN202411972861

申请日期：2024-12-30

公开号：CN119815146A

公开日期：2025-04-11

类型：发明专利

摘要

本发明实施例公开了一种视频生成模型训练方法、装置、设备和介质，其中，方法包括：将视频样本输入到经过预训练的空间变分自动编码器进行空间编码，得到视频空间编码结果；将视频空间编码结果输入到经过预训练的时间变分自动编码器进行时间编码，得到视频时空编码结果；基于视频时空编码结果对待训练视频生成模型进行训练，得到目标视频生成模型；其中，待训练视频生成模型为扩散模型。本发明实施例的技术方案解决了目前视频生成模型训练计算负荷大的问题，可以在模型训练时在空间和时间维度上对视频样本进行编码，减少模型训练过程中的计算资源需求量，提高模型训练效率。

技术关键词

视频生成模型变分自动编码器编码特征视频解码视频编码编码模块编码器训练样本计算机设备模型训练模块处理器计算机程序产品噪声注意力机制训练装置数据可读存储介质

系统为您推荐了相关专利信息

基于混合注意力和元原型网络的视频异常检测方法

视频异常检测方法原型编码向量 Sigmoid函数网络

企业知识管理中的多模态数据融合方法、装置、设备及介质

企业知识管理数据融合方法语义注意力方法图谱

用于电缆生产的智能管理系统及方法

编码特征智能管理方法编码向量决策拉普拉斯

一种融合红外与可见光信息的目标检测装置

红外光编码向量光照特征可见光图像编码特征

一种自动生成视频并循环播放演示的方法、系统及介质

视频播放模式操作界面图像捕捉视频播放器鼠标