一种基于扩散模型光流轨迹控制的视频生成方法
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
一种基于扩散模型光流轨迹控制的视频生成方法
申请号:
CN202510402278
申请日期:
2025-04-01
公开号:
CN120201260A
公开日期:
2025-06-24
类型:
发明专利
摘要
本发明提供了一种基于扩散模型光流轨迹控制的视频生成方法,包括以下步骤:S1.处理训练视频与光流轨迹建模;S2.计算光流轨迹与动态注意力优化;S3.扩散建模;S4.模型推理与隐向量重构。本发明通过光流轨迹建模、动态注意力优化和隐向量重构三大核心技术,提升了运动信息捕捉的精度、视频生成的细节质量,并实现了个性化风格控制,相较传统方法在运动准确性、视频连贯性和个性化定制能力上具有显著优势,解决了现有技术中少样本视频生成中的精度不足,无法有效提取训练视频中的运动信息的问题。
技术关键词
视频生成方法
视频帧
注意力
密度聚类算法
损失函数优化
轨迹特征
重构
视觉特征
运动
动态
图像
像素
编码器
精度
风格
文本
噪声
系统为您推荐了相关专利信息
1
一种化学反应大语言模型训练方法及合成路径规划方法
大语言模型
路径规划方法
蒙特卡洛树搜索
分子
阶段
2
视频理解问题的答案生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品
文本
短视频
大语言模型
字幕
样本
3
基于实例感知与记忆修正的半监督视频目标分割方法
分割方法
多分辨率特征
键特征
Sigmoid函数
融合特征
4
基于蛋白质语言模型的肽毒性预测方法及系统
毒性预测方法
序列
长短期记忆网络
注意力机制
数据
5
中医古籍知识图谱构建方法、设备、介质
知识图谱构建方法
实体识别模型
注意力机制
上下文特征
预训练语言模型