摘要
本发明涉及检索技术领域,公开了一种基于大语言模型的法律条款向量检索方法,具体按以下步骤执行:首先对输入的合同文档进行处理,将合同分割成多个章节;每个章节进一步根据规则细分为段落;进行加权平均处理,确定最终章节,其中非表格的自然章节根据标题特征进行划分,表格按照表头信息进行按行划分成独立的章节,将每个分割后的章节单独保存,形成多个独立的文本块;其中对于自然段落直接划分为段落,对于列举式需要整体作为一个整体的段落,选择式只将选择式的标题与相应被选中的选项作为一个整体的段落。本发明简洁且效率高,摒弃与风险描述无关信息的影响,可以有效避免合同文本过长,内容过于复杂对于大模型向量检索效果的负面影响。