利用多模态大模型处理多模态数据的方法及装置

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
利用多模态大模型处理多模态数据的方法及装置
申请号:CN202510225325
申请日期:2025-02-26
公开号:CN120068940A
公开日期:2025-05-30
类型:发明专利
摘要
本说明书实施例提供一种利用多模态大模型处理多模态数据的方法,该多模态大模型中包括大语言模型,该大语言模型包括多个注意力头,多个注意力头对应于不同的掩码矩阵,该方法包括:利用多个注意力头中的目标注意力头对多个表征向量进行注意力处理,得到初始注意力矩阵,该多个表征向量包括,输入图像对应的若干图像表征,以及输入文本对应的若干文本表征。利用目标注意力头对应的目标掩码矩阵对初始注意力矩阵进行掩码处理,得到更新注意力矩阵,目标掩码矩阵在行号小于列号的若干目标位置具有有效值。
技术关键词
掩码矩阵 大语言模型 图像编码器 文本 多模态 有效值 适配器 注意力机制 基础 索引 答案 计算机 可读存储介质 处理单元 存储器 数据 处理器