一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法
申请号:CN202510102238
申请日期:2025-01-22
公开号:CN119946271A
公开日期:2025-05-06
类型:发明专利
摘要
本发明公开了一种基于混合注意力和SwinV2熵模型的端到端图像压缩方法,包括:将待压缩图像输入训练好的图像压缩模型中输出重建图像;模型的训练步骤包括:对输入的原始图像x经卷积变换后生成的若干个通道特征进行特征提取并自适应地关注对压缩任务重要的通道特征,生成潜在表示y;获潜在表示y之间的冗余信息,计算高斯分布(μ,σ);使用高斯概率模型结合高斯分布对潜在表示y进行建模,生成潜在表示对潜在表示进行解码重建生成重建图像;基于重建图像和原始图像之间的差值以及压缩原始图像产生的码流比特数计算损失函数并反向优化模型参数;迭代训练直至模型收敛或达到最大迭代次数。本发明能够提高模型的压缩性能并显著降低模型的复杂度。
技术关键词
图像压缩方法 注意力 多层感知机 模块 输出特征 高斯概率模型 主编码器 切片 解码器 比特数 支路 通道 参数 网络 冗余 复杂度