一种针对多塔神经网络的模型训练方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种针对多塔神经网络的模型训练方法及装置
申请号:CN202410918883
申请日期:2024-07-09
公开号:CN118917379A
公开日期:2024-11-08
类型:发明专利
摘要
本说明书一个或多个实施例提供一种针对多塔神经网络的模型训练方法及装置,包括:基于获取的样本集以及样本集中每个样本所对应的多源噪声标记组,通过第一损失函数对多塔神经网络进行第一阶段训练;确定每一样本分别对应于各个标记源视角的多源聚合输出概率;基于由第一损失函数与第二损失函数构建的目标损失函数对多塔神经网络进行第二阶段训练;第二损失函数为多塔神经网络在每一标记源视角下分别对样本集中的每一样本输出的概率值与相应样本对应于相应标记源视角的多源聚合输出概率之间的损失的加权平均值,任一标记源视角下对任一样本对应的损失的权重与多塔神经网络在该标记源视角下对该样本的认知的可靠程度呈负相关。
技术关键词
标记 视角 样本 单轮 模型训练方法 多源噪声 蒸馏 标签 网络 教师 学生 欺诈检测 处理器 指令 计算机程序产品 可读存储介质 电子设备 数据