摘要
本申请提出一种科研文档信息提取方法及装置,包括:从科研文档中,构建术语语义网络;基于对术语语义网络进行置信度排序,获取科研文档中候选术语抽取结果;根据候选术语抽取结果,从术语语义网络中,抽取概念属性;基于对候选术语抽取结果和概念属性进行聚类,构建领域知识图谱。通过构建术语语义网络,并进行置信度排序,获取科研文档的候选术语抽取结果,进而获取术语语义网络的概念属性,将候选术语抽取结果和概念属性进行聚类,从而获得领域知识图谱。实现了不同类型科研文档中领域术语、概念及属性等关键信息的自动获取,构建对应领域知识的描述体系,准确获取科研文档中隐含的逻辑结构,为科研信息管理、分析和利用提供有力支撑。