摘要
本发明提供一种基于自然语言处理和深度学习算法的知识抽取方法,在获取某地区耕地的监测成果数据的基础上,采用斯坦福七步法构建耕地“非粮化”监测成果知识本体模型;进而以深度学习模型作为核心,采用Pipeline技术实施所述知识抽取任务,提取包含实体、关系与实体间的连接信息的三元组结构,完成耕地“非粮化”监测成果非结构化数据的知识抽取。该方法结合了双向长短期记忆网络模型和预训练语言模型RoBERTa的优势,并加入了条件随机场CRF,能准确高效地提取耕地“非粮化”领域包含实体、关系与实体间的连接信息的三元组。