摘要
本发明涉及视频分析技术领域,具体为基于网格布局交替扩散和多注意力控制的视频编辑方法,本发明中,将原始视频帧序列分割为多个网格,每个网格包含连续排列的多个像素空间视频帧,形成网格化数据;通过编码器将所述网格化数据映射至低维潜空间,生成初始潜空间特征数据;对初始潜空间特征数据进行编辑,编辑过程包括扩散过程和采样过程,其中扩散过程基于预训练的稳定扩散模型,并嵌入时间注意力模块;在采样过程中,对网格布局执行奇偶时间步交替置换策略,以促进跨网格全局一致性,同时根据时间戳阈值动态融合重构分支与编辑分支的注意力图,生成去噪数据;通过解码器将去噪数据解码并拆分重组,生成编辑后的连续视频帧序列。