摘要
本申请涉及文本处理领域,尤其涉及一种用于招投标法律文档大语言模型的检索系统。包括文档预处理模块、语义切块模块、实体与关系识别模块、知识图谱构建模块、多策略混合检索模块、检索结果择优模块。在工作时对招投标法律文档进行预处理,基于文档字数判断采用章节级切块或条款级切块策略切割,使用LateChunking算法确定切割点并提取语义单元,识别实体要素并构建知识图谱,通过多策略混合检索和择优处理得到最优检索结果。克服了传统单一检索方式在招投标法律长文档处理中的局限性,提升了条文检索的准确性与上下文连贯性,从而大幅降低大语言模型因信息缺失或误解而产生幻觉的风险,增强了法律智能问答结果的可信度与实用性。