一种信审对话数据构建方法

申请号：CN202510291380

申请日期：2025-03-12

公开号：CN120218086A

公开日期：2025-06-27

类型：发明专利

摘要

本发明提供了一种信审对话数据构建方法，该方法具体如下：(1)采集信审对话文本，采用大模型对信审对话文本进行打分，将分值高的信审对话文本作为样本数据；(2)以大模型作为教师模型，以小模型作为学生模型，基于样本数据对教师模型进行蒸馏，将教师模型的打分能力蒸馏至学生模型，将训练好的小模型用于信审对话文本质量的打分。通过大模型驱动信审对话数据的清晰和评分筛选，显著提升信审对话文本数据，高质量的审对话数据可有效增强大语言模型后续训练效果，满足信审对话领域专业性需求，助力信审外呼精准化、智能化与数字化转型，此外极大的减少了人工的干预量。

技术关键词

数据构建方法文本打分器样本教师蒸馏学生报告大语言模型系列助力数值