一种基于置信度校正与一致性学习的噪声跨模态检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于置信度校正与一致性学习的噪声跨模态检索方法
申请号:CN202510496560
申请日期:2025-04-21
公开号:CN120407711A
公开日期:2025-08-01
类型:发明专利
摘要
本发明公开了一种基于置信度校正与一致性学习的噪声跨模态检索方法,属于多媒体检索的跨模态检索技术领域。首先在预热阶段预热模型和模型,利用损失优化初始匹配关系。在正式训练阶段,采用协同教学范式训练双模型,通过双组分高斯混合模型对正样本对损失分布建模,根据阈值将其划分为干净子集、不确定子集和噪声子集。针对不同子集设计不同置信度校正策略,进一步结合预训练视觉模型提取的图像单模态特征、预训练语言模型提取的文本单模态特征计算跨模态相似度,对负样本对进行判别。最终联合正样本对损失和负样本对损失,形成噪声鲁棒性增强的跨模态对齐框架。本发明有效提升噪声场景下的检索准确性,在多媒体检索领域具有实用价值。
技术关键词
模态特征 样本 跨模态检索方法 预训练语言模型 损失函数优化 文本编码器 图像编码器 噪声图像 超参数 图像匹配 校正 高斯混合模型 定义 概率密度函数
系统为您推荐了相关专利信息
结构化查询语句 关系型数据库 数据库结构 预训练语言模型 对象
预警模型 训练样本数据 数据采集方法 内存 计算机可执行指令
换流变压器 温升计算方法 拉丁超立方采样 仿真模型 输出特征
大语言模型 数据编码方法 样本 列表 数据编码装置
微多普勒 手势识别方法 手势识别模型 特征提取模块 图像