一种跨模态检索模型建模方法、装置、终端及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种跨模态检索模型建模方法、装置、终端及介质
申请号:CN202510969597
申请日期:2025-07-15
公开号:CN120492701B
公开日期:2025-09-09
类型:发明专利
摘要
本申请公开了一种跨模态检索模型建模方法、装置、终端及介质,涉及跨模态检索技术领域,本申请提供的方案首先基于不同模态的样本数据,按照不同的模态类型对样本数据进行特征解耦,再基于解耦后的特征计算温度参数以及构建跨模态对比学习模型架构,再通过跨模态对比学习模型的迭代训练,得到跨模态检索模型。本方案通过将不同模态数据的整体特征分解为具有明确语义指向且维度统一的多粒度特征,保留了模态数据内部丰富的语义信息,能够为后续的跨模态对比学习提供了更具区分度和针对性的特征表示,有助于提升跨模态检索模型对复杂语义关系的理解和匹配能力,从而提高跨模态检索的整体性能。
技术关键词
模型建模方法 样本 视频图像特征 语义角色标注 分层 对象 参数 跨模态检索技术 场景 实体 音频特征 注意力机制 传播算法 存储程序代码 数据获取单元 可读存储介质 建模装置