摘要
本发明提供了一种信审对话数据构建方法,该方法具体如下:(1)采集信审对话文本,采用大模型对信审对话文本进行打分,将分值高的信审对话文本作为样本数据;(2)以大模型作为教师模型,以小模型作为学生模型,基于样本数据对教师模型进行蒸馏,将教师模型的打分能力蒸馏至学生模型,将训练好的小模型用于信审对话文本质量的打分。通过大模型驱动信审对话数据的清晰和评分筛选,显著提升信审对话文本数据,高质量的审对话数据可有效增强大语言模型后续训练效果,满足信审对话领域专业性需求,助力信审外呼精准化、智能化与数字化转型,此外极大的减少了人工的干预量。