摘要
本发明提供一种语义驱动的真实场景视频超分方法及系统,属于视频数据技术领域。对获取的低分辨率视频进行理解,转化为层次化的语义表示形式;对获取的低分辨率视频交替使用通道自注意力和通道互注意力来提取帧内特征和帧间特征,并进行融合,通过运动补偿操作得到对齐后的特征,根据对齐后的特征进行粗粒度复原视频;向粗粒度复原视频中添加高斯噪声,获得当前扩散步的中间状态,转换到语义等效空间,解码潜在向量以生成细化后的帧;将粗粒度复原视频和细化后的帧进行深度卷积相融合,生成最终的超分重建帧。本发明基于层次化的语义表示提升复杂退化场景下视频的重建保真度和真实感,增强重建视频中纹理细节的清晰度和真实感。