基于对比掩码跨模态哈希学习的降质图像-文本检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于对比掩码跨模态哈希学习的降质图像-文本检索方法
申请号:CN202510556259
申请日期:2025-04-29
公开号:CN120492661A
公开日期:2025-08-15
类型:发明专利
摘要
本发明公开了一种基于对比掩码跨模态哈希学习的降质图像‑文本检索方法,该方法为:首先使用随机增强策略对数据进行增强,使用块级掩码策略处理强增强数据,获得图像和文本的增强视图和掩码视图;然后分别提取图像和文本特征,经过交叉注意力模块后输入哈希层得到图像和文本的哈希码;采用多模态对比损失和基于代理的相似性度量损失,利用原始数据特征语义信息重建被掩码数据特征,设计语义掩码重建交叉熵损失,并加入量化损失,确定总体目标函数,通过反向传播更新模型参数;最后使用训练好的模型参数,进行降质图像‑文本检索。本发明提升了在图像模糊、文本缺失等复杂场景下的跨模态检索的精度。
技术关键词
文本检索方法 图像块特征 跨模态 注意力 多模态 更新模型参数 掩码策略 文本编码器 样本 序列 输出特征 语义 相似性度量学习 Softmax函数 同义词 定义 三元组
系统为您推荐了相关专利信息
ZnO避雷器 设备健康监控方法 物联网技术 LSTM神经网络 老化特征
强化学习算法 主机 DQN算法 策略 梯度下降法
语义分割方法 局部注意力机制 图像分割网络 血管分割 光线投射算法
人工启动子 天然启动子 量预测方法 深度学习框架 深度学习模型
筛查方法 多模态数据融合 时间片 指标 患者健康数据