摘要
本发明提供的QA驱动的大模型层次化知识图谱参数化构建的方法,通过将非结构化文档分段,并结合语言模型生成结构化问答对,实现从原始文本到知识单元的自动抽取,降低人工参与成本;接着,通过将提取的问题内容与实体类别、原子结点和中间结点建立语义归属和层级关系,实现知识图谱的系统化分层组织,结构清晰、逻辑完整。并且,采用语义聚类算法对底层结点进行归类,在满足图谱结构约束条件的前提下,自动构建中间结点,避免冗余和重复;最后,通过问答对驱动的信息粒度分解,结合原子结点构建,显著提升知识抽取的精细程度和图谱表征的表达力。