基于大语言模型的超长文本检索问答方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于大语言模型的超长文本检索问答方法、装置、设备及介质
申请号:CN202410878463
申请日期:2024-07-02
公开号:CN118820424A
公开日期:2024-10-22
类型:发明专利
摘要
本发明实施例公开了一种基于大语言模型的超长文本检索问答方法、装置、设备及介质,其中,方法包括:对获取的原始超长文本数据进行预处理得到目标数据;采用Embedding编码模型对目标数据进行编码得到编码向量数据,并将编码向量数据存储至向量数据库;将获取的待查询问题输入至大语言模型以输出初始回答数据;采用Embedding编码模型对初始回答数据进行编码得到编码回答向量数据;根据编码回答向量数据对向量数据库中的编码向量数据进行检索得到相似回答向量数据,并将相似回答向量数据输入至大语言模型以生成最终答案结果。本申请实施例提高了超长文本检索问答的准确度。
技术关键词
大语言模型 编码向量 问答方法 样本 词频统计 文本 数据存储 计算机设备 索引算法 答案 处理器 问答装置 可读存储介质 处理单元 存储器 参数
系统为您推荐了相关专利信息
自然语言查询方法 自然语言查询系统 关系型数据库 大语言模型 关键字
航空发动机叶片 识别方法 检测航空发动机 缺陷检测识别 底片
线条 监测方法 关键工艺参数 样本 YOLO模型
知识库构建方法 实体 平台 大语言模型 预训练模型
电网基建项目 智能评审方法 大语言模型 统计特征 字符