摘要
本发明属于信息化管理技术领域,具体涉及一种基于相似度计算的数据导入方法,通过计算文件字段与数据库中字段的相似度,实现文件字段与数据库字段的自动匹配,能够有效减少人工配置的工作量;对常用的编辑距离计算相似度算法进行改进,考虑最长公共子序列对于相似度计算的影响,对相似度计算公式进行改进,提高匹配的成功率;在计算相似度时,采用改进的编辑距离计算相似度算法与基于《知网》的词语语义相似度计算相结合的方法,能够进行字面匹配和语义匹配,有效的提高了匹配的成功率;除了自动匹配以外,提供用户配置接口,用户能够手动调整映射关系,提升该方法的灵活性和可用性;能够自动记录用户配置内容,避免用户重复配置工作。