基于网格布局交替扩散和多注意力控制的视频编辑方法

申请号：CN202511001007

申请日期：2025-07-21

公开号：CN120512592B

公开日期：2025-10-24

类型：发明专利

摘要

本发明涉及视频分析技术领域，具体为基于网格布局交替扩散和多注意力控制的视频编辑方法，本发明中，将原始视频帧序列分割为多个网格，每个网格包含连续排列的多个像素空间视频帧，形成网格化数据；通过编码器将所述网格化数据映射至低维潜空间，生成初始潜空间特征数据；对初始潜空间特征数据进行编辑，编辑过程包括扩散过程和采样过程，其中扩散过程基于预训练的稳定扩散模型，并嵌入时间注意力模块；在采样过程中，对网格布局执行奇偶时间步交替置换策略，以促进跨网格全局一致性，同时根据时间戳阈值动态融合重构分支与编辑分支的注意力图，生成去噪数据；通过解码器将去噪数据解码并拆分重组，生成编辑后的连续视频帧序列。

技术关键词

视频编辑方法注意力网格噪声预测布局分支数据解码像素编码器模块视频分析技术重构解码器序列阶段视频帧间

系统为您推荐了相关专利信息

基于牧羊犬模型的扫地机器人驱赶扩散方法

扫地机器人密度坐标网格矩阵

电力设备室内外异常入侵监控方法、系统及存储介质

入侵监控方法电力设备像素点声纹特征神经网络模型

基于人工智能的眼动校准识别方法、装置及系统

识别方法校准眼球运动轨迹空间分布特征融合特征

一种场景重建方法、装置和设备

动态车辆网格场景重建方法图像

基于组件化设计器的管理驾驶舱软件系统及其实现方法

驾驶舱数据传输策略前端组件博弈论模型关系型数据库