摘要
本发明涉及知识图谱技术领域,具体公开了一种多领域自适应的实体消歧方法及系统,其检测领域文本序列中的所有提及;从资源库中获取每一个提及的候选实体,构建每一个提及的候选实体集合,并从每一个提及的候选实体集合中找到匹配分数最高的实体;基于每一个提及的候选实体集合及其匹配分数最高的实体对领域文本序列进行切割,得到多段视为提及的分段文本;在每一个分段文本所对应提及的候选实体集合中找到最匹配的实体。本发明将全局与局部融合,可用少量的数据分析来提高文本的实体链接性能;通过引入实体关键词、实体概念作为显式的细粒度主题,能够更精确地捕捉文本中的上下文信息;在文本切割中引入短语先验,使语义更敏感。