摘要
本发明涉及一种文档问答方法、装置、电子设备及计算机存储介质,该方法包括:基于预设片段长度,对每个样本文档进行对齐处理,得到多个样本片段;对任意两个样本片段进行语义相关度标注得到第一标注数据,根据第一标注数据对文档检索模型进行微调得到目标文档检索模型;基于多个样本片段和语义相关度确定第二标注数据,根据第二标注数据对语义排序模型进行微调得到目标语义排序模型,基于多个问题和每个问题对应的至少一个样本片段,构成第四标注数据,基于第四标注数据对基础大模型进行微调得到生成式大模型,基于微调后的三个模型确定待处理问题对应的目标答案。本发明的方法在根本上解决通用大模型问答在铁路领域数据集上经常出现的问题。