基于相似样本的对比学习实体匹配方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于相似样本的对比学习实体匹配方法及系统
申请号:CN202510539497
申请日期:2025-04-27
公开号:CN120541536A
公开日期:2025-08-26
类型:发明专利
摘要
本发明涉及数据挖掘技术领域,特别涉及一种基于相似样本的对比学习实体匹配方法及系统,对待匹配实体数据集中的待匹配实体进行序列化表示;将待匹配实体的序列化表示输入至实体匹配模型,利用实体匹配模型得到待匹配实体数据集中各实体对匹配结果,所述实体匹配模型为基于正实体对样本、负实体对样本和相似实体对样本并利用对比学习机制对模型进行训练,以使模型学习不同实体间的相似性和差异性,其中,所述相似实体对样本为实体对相似但不匹配的实体样本数据。本发明将相似但不匹配的实体作为相似样本,为对比学习过程提供更全面的高质量对比样本,通过对比学习学习正、负和相似样本三类样本实体对的相似性与差异性特征,提升实体匹配效果。
技术关键词
实体匹配方法 样本 标记标签 预训练语言模型 矩阵 匹配模块 数据挖掘技术 可读存储介质 机制 注意力 表达式 语义特征 处理器 存储器 计算机 代表 序列