基于大语言模型的超长文本检索问答方法、装置、设备及介质

申请号：CN202410878463

申请日期：2024-07-02

公开号：CN118820424A

公开日期：2024-10-22

类型：发明专利

摘要

本发明实施例公开了一种基于大语言模型的超长文本检索问答方法、装置、设备及介质，其中，方法包括：对获取的原始超长文本数据进行预处理得到目标数据；采用Embedding编码模型对目标数据进行编码得到编码向量数据，并将编码向量数据存储至向量数据库；将获取的待查询问题输入至大语言模型以输出初始回答数据；采用Embedding编码模型对初始回答数据进行编码得到编码回答向量数据；根据编码回答向量数据对向量数据库中的编码向量数据进行检索得到相似回答向量数据，并将相似回答向量数据输入至大语言模型以生成最终答案结果。本申请实施例提高了超长文本检索问答的准确度。

技术关键词

大语言模型编码向量问答方法样本词频统计文本数据存储计算机设备索引算法答案处理器问答装置可读存储介质处理单元存储器参数

系统为您推荐了相关专利信息

一种关系型数据库的自然语言查询方法及系统

自然语言查询方法自然语言查询系统关系型数据库大语言模型关键字

基于人工智能的底片评片的自动检测识别方法

航空发动机叶片识别方法检测航空发动机缺陷检测识别底片

基于多算法协同的熔融沉积成型的智能工艺优化与实时质量监测方法

线条监测方法关键工艺参数样本 YOLO模型

一种场景和版本适配的数据处理合规风险知识库构建方法

知识库构建方法实体平台大语言模型预训练模型

一种电网基建项目的可研智能评审方法及系统

电网基建项目智能评审方法大语言模型统计特征字符