基于大语言模型检索增强生成的方法、系统、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大语言模型检索增强生成的方法、系统、设备及介质
申请号:CN202411070464
申请日期:2024-08-06
公开号:CN118964387A
公开日期:2024-11-15
类型:发明专利
摘要
本发明公开了一种基于大语言模型检索增强生成的方法、系统、设备及介质,该方法包括:将文本文件分片,得到多个父文本块,并为每个父文本块生成唯一标识,将所有父文本块及其对应的唯一标识存入关系型数据库;将每个父文本块再次分片得到多个子文本块,对每个父文本块进行文本总结,得到多个父文本块总结文本;针对每个父文本块生成一个或多个假设性提问;将子文本块、父文本块总结文本、父文本块假设性提问进行向量化,并存入向量数据库中;基于用户输入的查询问题文本,在向量数据库中进行查询并提取唯一标识,获取若干个父文本块;将若干个父文本块与用户提出的问题组成提示词,生成最终答案。本发明提升了语义检索的准确性和召回率。
技术关键词
文本 大语言模型 关系型数据库 标识 分片 答案 语义 可读存储介质 处理器 模块 计算机设备 指令 存储器 界面