摘要
本发明公开了一种大规模稀土数据信息提取方法,涉及稀土研究技术领域,该大规模稀土数据信息提取方法,包括稀土产品生产方法专利命名实体识别数据集的构建,针对目前在稀土产品生产方法专利领域数据集缺乏的现状,对稀土产品生产方法专利领域数据集的相关概述,对稀土产品生产方法专利文本的内容进行分析,对稀土产品生产方法专利数据集进行了实体类别的划分,且详细介绍了各个类别的情况,对稀土产品生产方法专利数据集的实体进行标注工作的介绍,包括了实体类别标签的定义,使用工具对实体类别的标注,导出json数据文件,使用脚本程序对json数据文件进行BIOES的转换。