一种基于大语言模型的法律条款向量检索方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于大语言模型的法律条款向量检索方法
申请号:CN202411039710
申请日期:2024-07-31
公开号:CN119128182A
公开日期:2024-12-13
类型:发明专利
摘要
本发明涉及检索技术领域,公开了一种基于大语言模型的法律条款向量检索方法,具体按以下步骤执行:首先对输入的合同文档进行处理,将合同分割成多个章节;每个章节进一步根据规则细分为段落;进行加权平均处理,确定最终章节,其中非表格的自然章节根据标题特征进行划分,表格按照表头信息进行按行划分成独立的章节,将每个分割后的章节单独保存,形成多个独立的文本块;其中对于自然段落直接划分为段落,对于列举式需要整体作为一个整体的段落,选择式只将选择式的标题与相应被选中的选项作为一个整体的段落。本发明简洁且效率高,摒弃与风险描述无关信息的影响,可以有效避免合同文本过长,内容过于复杂对于大模型向量检索效果的负面影响。
技术关键词
向量检索方法 大语言模型 文本 表格 检索技术 表头 风险 可读存储介质 开方 词语 分词 列表 计算机 控制器 算法 定义