模型训练方法、装置、设备及介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
模型训练方法、装置、设备及介质
申请号:CN202511212323
申请日期:2025-08-27
公开号:CN120975182A
公开日期:2025-11-18
类型:发明专利
摘要
本公开提供了一种模型训练方法、装置、设备及介质,该方法包括:将多模态数据输入至学生模型,得到多模态特征和第一输出结果,多模态特征包括图像模态特征、语音模态特征和文本模态特征中至少一个;将多模态特征输入至教师模型,对多模态特征进行特征编码得到多个特征向量以及每个特征向量的置信度;基于置信度和特征向量,生成第二输出结果;基于第一输出结果以及第二输出结果确定蒸馏损失;从教师模型的中间层和学生模型的中间层获取中间结果以确定中层损失;基于蒸馏损失和中层损失更新学生模型的参数。
技术关键词
多模态特征 中间层 学生 教师 模型训练方法 蒸馏 矩阵 模型训练装置 编码 输入模块 处理器 注意力机制 文本 语音 校准器 参数 存储装置 可读存储介质