一种基于扩散模型光流轨迹控制的视频生成方法

申请号：CN202510402278

申请日期：2025-04-01

公开号：CN120201260A

公开日期：2025-06-24

类型：发明专利

摘要

本发明提供了一种基于扩散模型光流轨迹控制的视频生成方法，包括以下步骤：S1.处理训练视频与光流轨迹建模；S2.计算光流轨迹与动态注意力优化；S3.扩散建模；S4.模型推理与隐向量重构。本发明通过光流轨迹建模、动态注意力优化和隐向量重构三大核心技术，提升了运动信息捕捉的精度、视频生成的细节质量，并实现了个性化风格控制，相较传统方法在运动准确性、视频连贯性和个性化定制能力上具有显著优势，解决了现有技术中少样本视频生成中的精度不足，无法有效提取训练视频中的运动信息的问题。

技术关键词

视频生成方法视频帧注意力密度聚类算法损失函数优化轨迹特征重构视觉特征运动动态图像像素编码器精度风格文本噪声

系统为您推荐了相关专利信息

一种化学反应大语言模型训练方法及合成路径规划方法

大语言模型路径规划方法蒙特卡洛树搜索分子阶段

视频理解问题的答案生成方法、装置、计算机设备、计算机可读存储介质和计算机程序产品

文本短视频大语言模型字幕样本

基于实例感知与记忆修正的半监督视频目标分割方法

分割方法多分辨率特征键特征 Sigmoid函数融合特征

基于蛋白质语言模型的肽毒性预测方法及系统

毒性预测方法序列长短期记忆网络注意力机制数据

中医古籍知识图谱构建方法、设备、介质

知识图谱构建方法实体识别模型注意力机制上下文特征预训练语言模型