一种多源异构数据对齐方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多源异构数据对齐方法及装置
申请号:CN202510489601
申请日期:2025-04-18
公开号:CN120541366A
公开日期:2025-08-26
类型:发明专利
摘要
本公开提出一种多源异构数据对齐方法及装置,涉及数据处理技术领域。其中,方法包括:利用共享编码器将文本特征与第一模态特征编码到相同模态子空间中;通过预先训练的第一Transformer模块,通过多头注意力机制得到文本交叉特征和第一模态交叉特征;通过预先训练的第一对比学习模块将文本交叉特征和第一模态交叉特征映射至向量空间进行特征对齐。本公开利用包含多头自注意力的Transformer模块对文本数据和第一模态数据进行处理,实现第一模态数据与文本数据间的跨模态粗对齐,利用对比学习方法实现跨模态数据之间的细粒度对齐,能够实现多源异构数据的精准语义对齐,为后续多模态数据融合奠定良好基础,提高多模态融合决策的决策能力。
技术关键词
模态特征 文本 样本 多源异构数据 多头注意力机制 高斯核函数 对齐方法 计算机执行指令 对齐模块 多模态数据融合 编码器 跨模态数据 特征提取模块 数据处理技术 对齐装置 学习方法