摘要
本申请公开了一种多模态数据增强方法、装置、设备及计算机程序产品,涉及数据处理技术领域,包括:获取多模态标注数据集;提取各原始文本数据的文本主体信息,并基于各文本主体信息以及各原始图片数据,得到若干组文本增强数据以及文本增强数据对应的目标内容相似图片;基于各原始图片数据以及各目标内容相似图片,得到若干组图片增强数据;将各文本增强数据与各图片增强数据进行关联组合,生成多模态增强数据集。本申请通过实现结合文本增强和图片增强两阶段相互衔接的数据增强方法,从内容层面对多模态标注数据进行增强,从而解决因图片和文本配对的数据需分别增强图片数据和文本数据,而导致降低数据增强的真实性、准确性以及有效性的问题。