基于多层次特征与双重编码的候选回复语句评分方法及装置
申请号:CN202510297544
申请日期:2025-03-13
公开号:CN120336868A
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种基于多层次特征与双重编码的候选回复语句评分方法及装置,包括:利用大语言模型构建训练数据集;构建候选回复语句评分模型并采用训练数据集和基于对比学习的损失函数对其进行训练,得到经训练的候选回复语句评分模型,候选回复语句评分模型包括词级特征提取模块、词级相似度计算模块、短语级特征提取模块、短语级相似度计算模块、句子级特征提取模块、句子级相似度计算模块和综合相似度计算模块,采用双重编码分别对对话历史和候选回复语句进行编码,再输入到经训练的候选回复语句评分模型,分别计算出词级相似度、短语级相似度和句子级相似度,并计算出综合相似度;根据综合相似度对候选回复语句进行排序,显著提升排序准确性。
技术关键词
语句
特征提取模块
多层次特征
评分方法
语义
编码
数据
样本
评分装置
处理器
大语言模型
计算机程序产品
注意力
输出特征
存储装置
可读存储介质
电子设备