一种多模态模型的训练方法和装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态模型的训练方法和装置
申请号:CN202411552370
申请日期:2024-11-01
公开号:CN119442149A
公开日期:2025-02-14
类型:发明专利
摘要
本发明公开一种多模态模型的训练方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取多模态模型的训练样本集,其中包括视频数据和文本数据;使用训练样本集对多模态模型进行训练,通过最小化第一损失函数、最小化第二损失函数和最小化第三损失函数中的至少两种,调整优化多模态模型的参数,得到训练后的多模态模型,第一损失函数是根据文本数据的全局特征与视频数据的全局特征构建的;第二损失函数是根据文本数据的局部特征与视频数据的局部特征构建的;第三损失函数是根据文本数据的全局特征与视频数据的局部特征构建的。该实施方式实现了细粒度化、全面的多模态模型的训练,赋予了多模态模型更细粒度、更深入的理解能力。
技术关键词
语义特征 多模态 数据 文本编码器 视频编码器 训练样本集 序列 移动电子设备 跨模态 模型训练模块 处理器 计算机程序产品 训练装置 参数 存储装置 分词