摘要
本公开涉及模型评估技术领域,提供了一种问答模型评估方法、装置、电子设备及可读存储介质。该方法包括:获取原始问答模型对应的评估数据集和对比问答模型对应的评估数据集;将二者的评估数据集输入至训练完成的评估模型进行格式化处理,得到对应的格式化数据;基于至少一个预设的结果标签对各自对应的格式化数据分别进行前向传播处理,得到各个预设的结果标签对应的原始问答分数和对比问答分数;并对其分别进行归一化处理,得到各自对应的目标结果分数;根据该目标结果分数确定原始问答模型和对比问答模型的评估结果标签,并将评估结果标签发送至目标终端设备上进行展示,以此提升了模型的泛化能力和稳定性,确保了数据的多样性与准确性。