多模态语言模型的训练方法和使用方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态语言模型的训练方法和使用方法
申请号:CN202410916790
申请日期:2024-07-10
公开号:CN118469039B
公开日期:2024-10-01
类型:发明专利
摘要
本发明提供一种多模态语言模型的训练方法和使用方法,包括:将预先采集的样本数据集基于类别进行编码与拼接,得到模型词典和拼接文本;根据模型词典、拼接文本得到词典索引矩阵B;将B与当前语言模型中的嵌入矩阵E相乘,得到嵌入向量;基于嵌入向量的上下文信息对当前语言模型的嵌入层、隐藏层和输出层的参数权重进行修正,得到修正后语言模型;将嵌入向量输入至修正后语言模型,得到预测tokens及其概率;计算预测tokens和样本答案的tokens之间损失L;若L大于预设的损失阈值,则重复以上步骤;否则,则将修正后语言模型作为训练好的多模态语言模型。本多模态语言模型可以同时精确识别自然语言和多媒体语言。
技术关键词
词典 样本 文本 索引 多模态 识别自然语言 矩阵乘法运算 图像处理模型 答案 语音 数据 分词 多媒体 参数 编码 代表 金融
系统为您推荐了相关专利信息
中文文本 序列 算术平均值 调用代理模型 计算机电子设备
智能检测系统 视觉采集装置 智能检测算法 多尺度特征 课堂教学场景
深度学习模型 历史运行数据 评估系统 逻辑回归模型 代表
图像特征向量 跟踪系统 模态特征 文本特征向量 前馈神经网络
控制发酵方法 肉干类食品 压力 肉干食品 序列