一种基于签名的集合语义相似度连接方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于签名的集合语义相似度连接方法
申请号:CN202510027523
申请日期:2025-01-08
公开号:CN119829743B
公开日期:2025-10-17
类型:发明专利
摘要
本发明涉及一种基于签名的集合语义相似度连接方法,属于数据库和信息检索领域。包括四部分内容:首先,分类树构建步骤:给定数据集,根据WordNet知识库构建分类树;其次,集合签名步骤:将数据集中每个集合进行签名,获得对应的签名数据集;随后,数据预处理步骤:将签名数据集中集合进行排序,得到排序后的数据集;最后,连接处理步骤:对排序后的数据集中的集合执行自连接,获得语义相似结果对集。本发明基于签名前缀过滤技术、长度过滤技术,最终实现集合语义相似度连接方法,可有效提高集合语义连接效率。
技术关键词
语义 数据 元素 匈牙利算法 信息检索 节点 频率