摘要
本发明涉及知识图谱技术领域,具体为基于无监督学习知识图谱构建方法及系统,所述方法包括:获取文本数据,对收集的文本数据进行预处理,并对文本数据进行分词,得到文本数据的分词结果;基于预训练语言模型,对文本数据的分词结果进行实体识别,并对文本数据中的实体识别结果进行歧义消除;采用无监督模型抽取实体关系,生成实体和实体关系三元组;构建实体关系权重计算公式,并将实体关系权重映射为实体关系置信度,过滤置信度值低于阈值的实体关系;基于文本数据中抽取的实体和实体关系,构建文本数据的知识图谱。本发明提高了知识图谱构建的效率和质量,为智能搜索、问答、推荐等知识驱动的应用提供了重要的知识支撑。