检索模型的训练方法、检索方法、电子设备、介质及产品
申请号:CN202411894689
申请日期:2024-12-20
公开号:CN119938983B
公开日期:2025-11-11
类型:发明专利
摘要
本申请公开了一种检索模型的训练方法、检索方法、电子设备、介质及产品,包括:获取原始数据集合,所述原始数据集合中包括多个原始视频‑文本对和对应的分类标记,所述分类标记用于指示原始视频‑文本对中的视频内容与文本内容是否一致;基于所述原始数据集合中的原始视频‑文本对分别进行增强处理,以得到对应的增强视频‑文本对;以原始视频‑文本对和对应的增强视频‑文本对为样本,以原始视频‑文本对应的分类标记为标签,对检索模型进行训练;基于视频‑文本对的提取特征计算的模态间相似度、模态内相似度构造检索模型的损失函数;对检索模型进行训练,直至损失函数收敛得到训练完的检索模型。
技术关键词
矩阵
文本编码器
视频编码器
检索方法
计算机程序产品
可读存储介质
标记
电子设备
处理器
机器翻译
标签
批量
同义词
指令
样本
存储器
模块