摘要
本发明公开一种基于专利数据的技术领域本体构建方法,首先获取专利数据集,并进行预处理;然后,将IPC主分类号对应的部名、大类名和小类名分别与通用知识库中的实体进行链接,得到第一、二、三层候选技术概念集;对第一、二层候选技术概念进行人工筛选,使用GAT模型对第三层候选技术概念进行自动筛选,得到第一、二、三技术概念层,建立各层之间的层级关系,得到静态层;接着,基于专利名称构建动态层,包括第四、五、六技术概念层及其层级关系;最后,建立第三、四技术概念层之间的层级关系,实现静态层和动态层的集成,得到有向无环图结构,即技术领域本体。该方法能够自动从专利数据中提取技术概念,构建多层次的技术领域本体,提高了构建效率。