基于变分自编码器改进熵模型的视频压缩方法及系统

申请号：CN202411481911

申请日期：2024-10-23

公开号：CN119011851B

公开日期：2025-06-17

类型：发明专利

摘要

本发明公开了一种基于变分自编码器改进熵模型的视频压缩方法及系统，此方法包括接收视频流中的当前帧数据，构建时空金字塔结构，生成多尺度持续图；将其与预设的传统视觉特征融合，得到时间上下文特征；提取超先验数据和潜在先验数据，拼接形成输入特征集；采用改进的分层条件变分自编码器，生成多层次潜在变量；计算在预定条件下的概率值，生成概率分布数据；进行上下文感知自适应量化，得到量化后的数据；进行动态熵编码优化，得到压缩数据包；执行率失真优化，得到优化后的压缩数据包；进行感知引导的解码重建，得到感知质量最优的重建视频帧。本发明减少了计算复杂度，使得本发明在保持高压缩效率的同时，更易于实现实时视频压缩。

技术关键词

视频压缩方法多层次生成网络模型金字塔结构上下文特征变量生成多尺度视频帧编码器视觉特征迭代优化算法后处理参数后处理技术算术编码算法拓扑特征重建原始数据去块效应滤波

系统为您推荐了相关专利信息

一种基于人工智能的通用抠图方法及系统

抠图系统抠图方法输出模块通道输入模块

基于状态空间编码对夜间混凝土图像进行增强的方法

编码器模块空间模块图像增强算法混凝土卷积深度网络

基于大数据和人工智能的井站仪表故障智能诊断系统及诊断方法

故障智能诊断方法预警模型故障智能诊断系统大数据高维特征向量

基于面部表情与上下文情境的学业情绪识别方法及装置

情绪识别方法令牌视觉特征上下文特征文本编码器

一种三维面部动画模块化生成系统

面部特征信息生成系统情绪特征上下文特征节点特征