一种基于相似度计算的数据导入方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于相似度计算的数据导入方法
申请号:CN202411956524
申请日期:2024-12-29
公开号:CN119938754A
公开日期:2025-05-06
类型:发明专利
摘要
本发明属于信息化管理技术领域,具体涉及一种基于相似度计算的数据导入方法,通过计算文件字段与数据库中字段的相似度,实现文件字段与数据库字段的自动匹配,能够有效减少人工配置的工作量;对常用的编辑距离计算相似度算法进行改进,考虑最长公共子序列对于相似度计算的影响,对相似度计算公式进行改进,提高匹配的成功率;在计算相似度时,采用改进的编辑距离计算相似度算法与基于《知网》的词语语义相似度计算相结合的方法,能够进行字面匹配和语义匹配,有效的提高了匹配的成功率;除了自动匹配以外,提供用户配置接口,用户能够手动调整映射关系,提升该方法的灵活性和可用性;能够自动记录用户配置内容,避免用户重复配置工作。
技术关键词
数据导入方法 字段 编辑 词语 语义 算法 信息化管理技术 表头 度计算方法 序列 身份证号 字符 关系 工作量 表格 矩阵 文本 参数 居民