摘要
本发明公开了一种基于变分自编码器改进熵模型的视频压缩方法及系统,此方法包括接收视频流中的当前帧数据,构建时空金字塔结构,生成多尺度持续图;将其与预设的传统视觉特征融合,得到时间上下文特征;提取超先验数据和潜在先验数据,拼接形成输入特征集;采用改进的分层条件变分自编码器,生成多层次潜在变量;计算在预定条件下的概率值,生成概率分布数据;进行上下文感知自适应量化,得到量化后的数据;进行动态熵编码优化,得到压缩数据包;执行率失真优化,得到优化后的压缩数据包;进行感知引导的解码重建,得到感知质量最优的重建视频帧。本发明减少了计算复杂度,使得本发明在保持高压缩效率的同时,更易于实现实时视频压缩。