一种基于模态调和的多模态模型训练方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于模态调和的多模态模型训练方法及装置
申请号:CN202410778100
申请日期:2024-06-17
公开号:CN118735005A
公开日期:2024-10-01
类型:发明专利
摘要
本发明提出一种基于模态调和的多模态模型训练方法和装置,包括:获取已标注类别标签的多模态数据,并将其转化为符合模型结构输入的指定形式,得到训练数据。构建包括多个学习器的多模态模型,每个学习器对应一种模态,用于提取对应模态数据的特征,根据各学习器提取的特征进行分类,通过分类结果和该类别标签构建损失函数,依次交替训练每一个模态的学习器,以完成对该多模态模型的训练;将待分类多模态数据输入训练完成后的多模态模型,得到每个学习器的输出特征,融合所有该输出特征,得到该待分类多模态数据的分类结果。
技术关键词
学习器 模型训练方法 输出特征 模型训练装置 随机梯度下降 信息显示设备 多模态 标签 人工智能模型 深度图 语义 电子设备 数据处理模块 算法 参数 图像