一种使用合成数据集加速视频扩散模型的方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种使用合成数据集加速视频扩散模型的方法
申请号:CN202510355770
申请日期:2025-03-25
公开号:CN120297362A
公开日期:2025-07-11
类型:发明专利
摘要
本发明公开了一种使用合成数据集加速视频扩散模型的方法。该方法包括:利用预训练的视频扩散模型生成合成数据集,该合成数据集包含合成视频、潜在空间中的去噪轨迹以及对应的文本提示;利用所述预训练的视频扩散模型作为教师模型,并构建对应的学生模型,所述学生模型和所述教师模型共享相同的结构;基于所述合成数据集,对所述学生模型进行知识蒸馏训练,在知识蒸馏训练过程中,所述学生模型学习所述教师模型的去噪过程并对齐所述教师模型生成的数据分布,直到满足设定的损失函数标准;将经知识蒸馏训练的学生模型作为视频生成模型,应用于视频分析任务。利用本发明,能够生成更高质量和更高分辨率的视频。
技术关键词
学生 教师 视频生成模型 蒸馏 视频分析 数据分布 轨迹 文本 生成对抗网络 特征提取器 噪声 处理器 参数 编码 计算机设备 可读存储介质 多模态 存储器