一种基于非结构化数据的检索增强方法和系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于非结构化数据的检索增强方法和系统
申请号:CN202511525301
申请日期:2025-10-24
公开号:CN120994813A
公开日期:2025-11-21
类型:发明专利
摘要
本发明提供一种基于非结构化数据的检索增强方法和系统,该方法包括:基于自然资源非结构化数据进行文档分类,得到各类文档信息,并基于各类文档信息中的各个语义单元的逻辑关系,构建向量知识库;基于向量知识库对查询问题进行语义理解和向量嵌入处理,得到查询问题对应的语义向量,并基于语义向量采用问题分类模型对查询问题进行分类,得到查询问题的类别信息;基于类别信息和向量知识库采用基于检索增强的检索策略进行检索操作,得到初步检索结果;基于初步检索结果分别进行内容完整性校验、内容合法性校验、内容一致性校验和提交文件规范性检验,得到检索增强结果。本发明实现了自然资源非结构化报件数据的高效、精准检索增强。
技术关键词
检索信息内容 自然资源 结构模块 图片 语义向量 结构框架 数据字 字段 格式 检索策略 文档分类 分辨率 缺失结构 列表 非暂态计算机可读存储介质 识别结构 信息查询系统 业务系统