一种多源异构数据语义对齐方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多源异构数据语义对齐方法、装置、设备及介质
申请号:CN202511484948
申请日期:2025-10-17
公开号:CN120952012A
公开日期:2025-11-14
类型:发明专利
摘要
本发明公开的多源异构数据语义对齐方法、装置、设备及介质,通过获取多源异构数据,并对所述多源异构数据进行预处理获得标准化数据单元集合;根据所述标准化数据单元集合结合对比学习构建样本对,对所述样本对间的距离进行训练优化,识别单元语义特征中的数据一致性,输出一致性标签;对所述标准化数据单元集合的每个单元进行无监督特征提取,获得单元潜在语义特征;基于所述一致性标签和所述单元潜在语义特征对所述多源异构数据进行语义对齐,构建语义空间。本申请方案能够实现多源异构数据的语义标准化对齐,确保设备多源异构数据在知识图谱中准确映射与融合。
技术关键词
多源异构数据 异构数据语义 语义特征 对齐方法 无监督特征提取 样本 非结构化文本 可读存储介质 节点 实体 神经网络参数 词向量模型 深度神经网络 降维算法 标签模块 对齐装置 图谱