多模态数据增强方法、装置、设备及计算机程序产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态数据增强方法、装置、设备及计算机程序产品
申请号:CN202510080675
申请日期:2025-01-17
公开号:CN120011811A
公开日期:2025-05-16
类型:发明专利
摘要
本申请公开了一种多模态数据增强方法、装置、设备及计算机程序产品,涉及数据处理技术领域,包括:获取多模态标注数据集;提取各原始文本数据的文本主体信息,并基于各文本主体信息以及各原始图片数据,得到若干组文本增强数据以及文本增强数据对应的目标内容相似图片;基于各原始图片数据以及各目标内容相似图片,得到若干组图片增强数据;将各文本增强数据与各图片增强数据进行关联组合,生成多模态增强数据集。本申请通过实现结合文本增强和图片增强两阶段相互衔接的数据增强方法,从内容层面对多模态标注数据进行增强,从而解决因图片和文本配对的数据需分别增强图片数据和文本数据,而导致降低数据增强的真实性、准确性以及有效性的问题。
技术关键词
文本 图片 多模态 计算机程序产品 景深 词语 图文 元素 语义 数据处理技术 数据获取模块 处理器 两阶段 存储器 有效性 图谱 关系 垫片