语义驱动的真实场景视频超分方法及系统

申请号：CN202510766304

申请日期：2025-06-10

公开号：CN120672579A

公开日期：2025-09-19

类型：发明专利

摘要

本发明提供一种语义驱动的真实场景视频超分方法及系统，属于视频数据技术领域。对获取的低分辨率视频进行理解，转化为层次化的语义表示形式；对获取的低分辨率视频交替使用通道自注意力和通道互注意力来提取帧内特征和帧间特征，并进行融合，通过运动补偿操作得到对齐后的特征，根据对齐后的特征进行粗粒度复原视频；向粗粒度复原视频中添加高斯噪声，获得当前扩散步的中间状态，转换到语义等效空间，解码潜在向量以生成细化后的帧；将粗粒度复原视频和细化后的帧进行深度卷积相融合，生成最终的超分重建帧。本发明基于层次化的语义表示提升复杂退化场景下视频的重建保真度和真实感，增强重建视频中纹理细节的清晰度和真实感。

技术关键词

视频超分方法语义非暂态计算机可读存储介质运动补偿场景视频数据技术融合时序信息处理器存储器通道注意力机制令牌前馈神经网络真实感电子设备运动估计噪声指令