摘要
本发明公开了一种多粒度生成式视频压缩方法,包括:获取视频帧序列,进行时空特征分解,将视频信号分解映射到三个潜在子空间,得到第一、第二和第三潜在子空间表示,其中第一潜在子空间表示为视频中的低频空间信息和时间缓变成分,第二潜在子空间表示为视频中的时空运动特征,第三潜在子空间表示为视频中的高频细节信息;分别对其进行编码处理,生成对应的第一、第二和第三编码数据,组合生成压缩码流。本发明有效解决了码率分配失衡问题,实现了内容自适应的高效压缩;增强了多尺度特征提取能力,避免了子带匹配失配问题,提升了压缩性能。