一种基于扩散模型的视频生成方法

申请号：CN202510403232

申请日期：2025-04-01

公开号：CN120151615A

公开日期：2025-06-13

类型：发明专利

摘要

本发明提供了一种基于扩散模型的视频生成方法，基于虚拟引擎物理数据生成模块进行物理场景模拟，生成物理场景数据输入多模态物理表征学习模块进行物理一致性预训练，得到联合物理表征向量、预训练后的扩散模型和预训练损失值输入物理强化学习框架对预训练后的扩散模型进行训练，得到训练后的扩散模型，并将物理场景数据输入训练后的扩散模型进行视频生成，得到与物理场景数据中的物理文本描述对应的视频输入物理一致性评估模块进行评估，得到评估结果输入物理强化学习框架对扩散模型进行更新，得到物理一致性视频生成模型；将目标文本数据输入物理一致性视频生成模型进行视频生成，得到与目标文本数据对应的视频，提升了视频生成的物理一致性。

技术关键词

视频生成方法强化学习框架视频生成模型场景文本拉丁超立方采样数据多模态参数物理特征提取交叉注意力机制表达式模块基础决策控制权逻辑

系统为您推荐了相关专利信息

一种多模态多任务的论坛用户跨站关联方法及系统

论坛帖子多模态多任务学习模型文本

用于根据文本提示生成合成视频数据的方法和设备

注意力文本视频机器学习模型大语言模型

一种基于机器学习的墨水配比优化方法及系统

配比优化方法墨水多模态物理参数编码器

一种基于数据分析的音响音效智能调节方法、系统及存储介质

智能调节方法音效生成控制器听觉场景音响

一种台风灾害链风险评估方法、装置、终端设备及存储介质

风险评估方法评估指标体系数据网络风险评估装置