摘要
本发明涉及数据信息提取技术领域,具体涉及基于知识图谱和混合检索的标书资质信息智能抽取方法,包括以下步骤:文档预处理和分块步骤:对招标文档进行预处理和分块处理,得到多个文档块;向量数据库构建步骤:对文档块进行向量化处理,存储到向量数据库中,并构建索引;知识图谱构建步骤:从文档块中提取三元组,将提取的三元组写入图数据库构建知识图谱,并构建索引;混合检索步骤:结合知识图谱和向量数据库进行混合检索;资质信息提取步骤:将混合检索返回的多个文档块及其对应的知识图谱子图作为上下文,使Agent智能体基于上下文和抽取模板进行提取;最后输出结构化的资质项信息。本发明能够实现对标书中资质信息的高质量结构化提取。