基于多模态对比学习和语义引导的水下图像质量评估模型
申请号:CN202510297837
申请日期:2025-03-13
公开号:CN120298315A
公开日期:2025-07-11
类型:发明专利
摘要
本发明提出了基于多模态对比学习和语义引导的水下图像质量评估方法现有的水下图像质量评估方法通常依赖大量人工注释来训练目标质量评估模型,本发明则主要采用无监督学习,旨在自动捕获水下图像的多种特征,形成准确的质量表示。通过质量对比学习与视觉语言对齐策略,结合混合比率的多样本感知相似性度量,本发明实现了图像与质量文本之间的精准对接。此外,模型还引入了嵌入语义提示信息的特征分层对比,借助质量相关的正负文本提示,将图像按质量层次进行分组,并通过相对排名的组对比损失,确保了高效的质量排序。最终,图像的统计特征引导无监督视觉语言模型,与视觉语言模型结合,成功实现了零样本的质量预测。
技术关键词
图像编码器
多模态
统计特征
文本编码器
图像特征向量
样本
排序损失
语义标签
水下图像数据
客观评价指标
视觉
纹理特征
语义特征
无监督学习
双编码器
线性