基于知识图谱和混合检索的标书资质信息智能抽取方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于知识图谱和混合检索的标书资质信息智能抽取方法
申请号:CN202510348873
申请日期:2025-03-24
公开号:CN120407728A
公开日期:2025-08-01
类型:发明专利
摘要
本发明涉及数据信息提取技术领域,具体涉及基于知识图谱和混合检索的标书资质信息智能抽取方法,包括以下步骤:文档预处理和分块步骤:对招标文档进行预处理和分块处理,得到多个文档块;向量数据库构建步骤:对文档块进行向量化处理,存储到向量数据库中,并构建索引;知识图谱构建步骤:从文档块中提取三元组,将提取的三元组写入图数据库构建知识图谱,并构建索引;混合检索步骤:结合知识图谱和向量数据库进行混合检索;资质信息提取步骤:将混合检索返回的多个文档块及其对应的知识图谱子图作为上下文,使Agent智能体基于上下文和抽取模板进行提取;最后输出结构化的资质项信息。本发明能够实现对标书中资质信息的高质量结构化提取。
技术关键词
信息智能抽取 三元组 构建知识图谱 知识图谱构建 分块 保留结构信息 索引 信息提取技术 模板 大语言模型 关键词 数据 层级 办法 格式 样本