多模态数据处理方法、装置、存储介质及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态数据处理方法、装置、存储介质及电子设备
申请号:CN202411058820
申请日期:2024-08-02
公开号:CN119226992B
公开日期:2025-07-18
类型:发明专利
摘要
本发明公开了一种多模态数据处理方法、装置、存储介质及电子设备。其中,所述方法包括:获取待识别的多模态数据,所述多模态数据包括图像数据和文本数据;获取所述图像数据对应的图像嵌入向量,基于预训练融合词表将所述图像嵌入向量转换为预融合编码向量;所述预训练融合词表为根据图像训练样本得到的用于减少图像特征的编码量的编码本;将所述预融合编码向量和文本数据对应的文本嵌入向量进行组合,得到目标多模态向量。本发明解决了相关技术中多模态大语言模型占用计算资源较多,难以有效地理解和融合多模态信息,整体性能不佳的技术问题。
技术关键词
图像训练样本 图像嵌入 图像编码 图像处理模型 编码向量 数据识别模型 文本 融合多模态信息 生成重构图像 生成对抗网络 电子设备 数据处理装置 大语言模型 存储器