基于网格布局交替扩散和多注意力控制的视频编辑方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于网格布局交替扩散和多注意力控制的视频编辑方法
申请号:CN202511001007
申请日期:2025-07-21
公开号:CN120512592B
公开日期:2025-10-24
类型:发明专利
摘要
本发明涉及视频分析技术领域,具体为基于网格布局交替扩散和多注意力控制的视频编辑方法,本发明中,将原始视频帧序列分割为多个网格,每个网格包含连续排列的多个像素空间视频帧,形成网格化数据;通过编码器将所述网格化数据映射至低维潜空间,生成初始潜空间特征数据;对初始潜空间特征数据进行编辑,编辑过程包括扩散过程和采样过程,其中扩散过程基于预训练的稳定扩散模型,并嵌入时间注意力模块;在采样过程中,对网格布局执行奇偶时间步交替置换策略,以促进跨网格全局一致性,同时根据时间戳阈值动态融合重构分支与编辑分支的注意力图,生成去噪数据;通过解码器将去噪数据解码并拆分重组,生成编辑后的连续视频帧序列。
技术关键词
视频编辑方法 注意力 网格 噪声预测 布局 分支 数据解码 像素 编码器模块 视频分析技术 重构 解码器 序列 阶段 视频帧间
系统为您推荐了相关专利信息
扫地机器人 密度 坐标 网格 矩阵
入侵监控方法 电力设备 像素点 声纹特征 神经网络模型
识别方法 校准 眼球运动轨迹 空间分布特征 融合特征
动态 车辆 网格 场景重建方法 图像
驾驶舱 数据传输策略 前端组件 博弈论模型 关系型数据库