一种基于扩散模型的视频生成方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于扩散模型的视频生成方法
申请号:CN202510403232
申请日期:2025-04-01
公开号:CN120151615A
公开日期:2025-06-13
类型:发明专利
摘要
本发明提供了一种基于扩散模型的视频生成方法,基于虚拟引擎物理数据生成模块进行物理场景模拟,生成物理场景数据输入多模态物理表征学习模块进行物理一致性预训练,得到联合物理表征向量、预训练后的扩散模型和预训练损失值输入物理强化学习框架对预训练后的扩散模型进行训练,得到训练后的扩散模型,并将物理场景数据输入训练后的扩散模型进行视频生成,得到与物理场景数据中的物理文本描述对应的视频输入物理一致性评估模块进行评估,得到评估结果输入物理强化学习框架对扩散模型进行更新,得到物理一致性视频生成模型;将目标文本数据输入物理一致性视频生成模型进行视频生成,得到与目标文本数据对应的视频,提升了视频生成的物理一致性。
技术关键词
视频生成方法 强化学习框架 视频生成模型 场景 文本 拉丁超立方采样 数据 多模态 参数 物理特征提取 交叉注意力机制 表达式 模块 基础 决策 控制权 逻辑
系统为您推荐了相关专利信息
论坛 帖子 多模态 多任务学习模型 文本
注意力 文本 视频 机器学习模型 大语言模型
配比优化方法 墨水 多模态 物理 参数编码器
智能调节方法 音效 生成控制器 听觉场景 音响
风险评估方法 评估指标体系 数据 网络 风险评估装置