问答模型评估方法、装置、电子设备及可读存储介质

申请号：CN202411918342

申请日期：2024-12-25

公开号：CN119377370A

公开日期：2025-01-28

类型：发明专利

摘要

本公开涉及模型评估技术领域，提供了一种问答模型评估方法、装置、电子设备及可读存储介质。该方法包括：获取原始问答模型对应的评估数据集和对比问答模型对应的评估数据集；将二者的评估数据集输入至训练完成的评估模型进行格式化处理，得到对应的格式化数据；基于至少一个预设的结果标签对各自对应的格式化数据分别进行前向传播处理，得到各个预设的结果标签对应的原始问答分数和对比问答分数；并对其分别进行归一化处理，得到各自对应的目标结果分数；根据该目标结果分数确定原始问答模型和对比问答模型的评估结果标签，并将评估结果标签发送至目标终端设备上进行展示，以此提升了模型的泛化能力和稳定性，确保了数据的多样性与准确性。

技术关键词

问答模型格式化数据标签模型评估技术答案终端设备文本电子设备可读存储介质大语言模型处理器评估装置多阶段模块多模态存储器模板转换器参数