摘要
本申请公开了一种命名实体识别方法、装置、设备及存储介质,涉及自然语言处理技术领域,该方法包括:通过目标领域对应的提示信息获取目标领域的初始实体本体,并基于初始实体本体创建实体本体数据集;获取待识别异构文档对应的文本格式文档,并提取文本格式文档中的目标子词;通过预设词相似度算法基于目标子词从实体本体数据集中确定目标已知实体;通过预设掩码命名实体识别方式基于目标已知实体对文本格式文档进行命名实体识别,获得实体识别结果。应用上述技术方案,解决了现有技术中的命名实体识别方法对标注数据的依赖性高,无法在标注数据稀缺的场景中高效应用的技术问题。