摘要
本发明公开了一种多模态数据处理方法、装置、存储介质及电子设备。其中,所述方法包括:获取待识别的多模态数据,所述多模态数据包括图像数据和文本数据;获取所述图像数据对应的图像嵌入向量,基于预训练融合词表将所述图像嵌入向量转换为预融合编码向量;所述预训练融合词表为根据图像训练样本得到的用于减少图像特征的编码量的编码本;将所述预融合编码向量和文本数据对应的文本嵌入向量进行组合,得到目标多模态向量。本发明解决了相关技术中多模态大语言模型占用计算资源较多,难以有效地理解和融合多模态信息,整体性能不佳的技术问题。