基于大语言模型的超长文本检索问答方法、装置、设备及介质
申请号:CN202410878463
申请日期:2024-07-02
公开号:CN118820424A
公开日期:2024-10-22
类型:发明专利
摘要
本发明实施例公开了一种基于大语言模型的超长文本检索问答方法、装置、设备及介质,其中,方法包括:对获取的原始超长文本数据进行预处理得到目标数据;采用Embedding编码模型对目标数据进行编码得到编码向量数据,并将编码向量数据存储至向量数据库;将获取的待查询问题输入至大语言模型以输出初始回答数据;采用Embedding编码模型对初始回答数据进行编码得到编码回答向量数据;根据编码回答向量数据对向量数据库中的编码向量数据进行检索得到相似回答向量数据,并将相似回答向量数据输入至大语言模型以生成最终答案结果。本申请实施例提高了超长文本检索问答的准确度。
技术关键词
大语言模型
编码向量
问答方法
样本
词频统计
文本
数据存储
计算机设备
索引算法
答案
处理器
问答装置
可读存储介质
处理单元
存储器
参数