摘要
本申请提供一种基于bert算法的知识抽取方法及相关设备。方法包括:获取待抽取知识的文本数据;包括结构化、半结构化或非结构化数据中的任意一种;对待抽取知识的文本数据进行预处理,分词处理,标注处理以及格式转换处理,得到待抽取知识的向量数据;待抽取知识的向量数据包括词向量数据和字向量数据;将待抽取知识的向量数据输入至预先训练的bert模型中,输出知识抽取结果数据;预先训练的bert模型为经过微调训练所得的bert模型;对知识抽取结果数据进行基于聚类的知识融合;存储知识融合后的数据至关系型数据库中;关系型数据库具有知识查询界面。能够提高知识抽取的准确率和效率,快速从大规模的文本数据中抽取有用的知识。