利用多模态大模型处理多模态数据的方法及装置
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
利用多模态大模型处理多模态数据的方法及装置
申请号:
CN202510225325
申请日期:
2025-02-26
公开号:
CN120068940A
公开日期:
2025-05-30
类型:
发明专利
摘要
本说明书实施例提供一种利用多模态大模型处理多模态数据的方法,该多模态大模型中包括大语言模型,该大语言模型包括多个注意力头,多个注意力头对应于不同的掩码矩阵,该方法包括:利用多个注意力头中的目标注意力头对多个表征向量进行注意力处理,得到初始注意力矩阵,该多个表征向量包括,输入图像对应的若干图像表征,以及输入文本对应的若干文本表征。利用目标注意力头对应的目标掩码矩阵对初始注意力矩阵进行掩码处理,得到更新注意力矩阵,目标掩码矩阵在行号小于列号的若干目标位置具有有效值。
技术关键词
掩码矩阵
大语言模型
图像编码器
文本
多模态
有效值
适配器
注意力机制
基础
索引
答案
计算机
可读存储介质
处理单元
存储器
数据
处理器