一种用于招投标法律文档大语言模型的检索系统

申请号：CN202511535792

申请日期：2025-10-27

公开号：CN120994814B

公开日期：2025-12-23

类型：发明专利

摘要

本申请涉及文本处理领域，尤其涉及一种用于招投标法律文档大语言模型的检索系统。包括文档预处理模块、语义切块模块、实体与关系识别模块、知识图谱构建模块、多策略混合检索模块、检索结果择优模块。在工作时对招投标法律文档进行预处理，基于文档字数判断采用章节级切块或条款级切块策略切割，使用LateChunking算法确定切割点并提取语义单元，识别实体要素并构建知识图谱，通过多策略混合检索和择优处理得到最优检索结果。克服了传统单一检索方式在招投标法律长文档处理中的局限性，提升了条文检索的准确性与上下文连贯性，从而大幅降低大语言模型因信息缺失或误解而产生幻觉的风险，增强了法律智能问答结果的可信度与实用性。

技术关键词

大语言模型实体知识图谱构建检索系统语义切块多策略识别模块关系答案标签知识图谱查询强化学习策略关键词构建知识图谱决策效能数据字符