一种基于文档块属性标签的RAG检索方法、装置及计算机可读存储介质
申请号:CN202510903663
申请日期:2025-07-01
公开号:CN120705335A
公开日期:2025-09-26
类型:发明专利
摘要
本发明属于数据处理的技术领域,更具体地,涉及一种基于文档块属性标签的RAG检索方法、装置及计算机可读存储介质。所述方法包括检查输入的文档内容主体一致,并将文档名称重命名为包含属性信息的格式;将文档按照内容逻辑或行文结构分块分割成更小的、可管理的文档块;标记文档块属性:根据重命名后文档的文件名信息,自动填充每个文档块的属性信息即贴标签;将文档块和对应的属性信息一起存入向量数据库;将用户需求的内容编码成向量,并在向量数据库中检索相似片段,得到最终检索的文档块;组合与回答生成。本发明解决了检索出的文档与问题关联性不高或检索出的文档或信息关联性较差,生成的答案可能会不准确,甚至是错误的回答等问题。
技术关键词
检索方法
文件名信息
大语言模型
可读存储介质
分块
贴标签
模版
计算机
处理器
编码
标记
元素
格式
逻辑
答案
表格
日期
标志
列表