一种多模态数据的生成方法、装置及存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种多模态数据的生成方法、装置及存储介质
申请号:CN202510072901
申请日期:2025-01-17
公开号:CN119478445A
公开日期:2025-02-18
类型:发明专利
摘要
本申请公开了一种多模态数据的生成方法、装置及存储介质,用于提高多模态模型在整体训练效果。获取预训练多模态模型的多模态数据集;根据多模态数据集的标注信息获取文字数据和音频数据的标签信息;根据标签信息从图像数据集提取出若干图像数据素材;将图像数据素材输入卷积神经网络模型中,通过标签特征增强模块并根据标签信息在图像数据素材上确定若干个特征区域;根据标签信息之间的层级参数对每一个特征区域进行特征增强处理,生成标签特征;通过正态分布采样为标签特征生成若干组正态分布参数;通过编码器将若干组正态分布参数和对应的标签信息进行重构,生成多模态重构的图像数据。
技术关键词
标签特征 卷积神经网络模型 生成方法 多模态 生成标签 数据 层级 参数 图像 输入输出单元 编码器 重构 注意力 噪声 生成装置 音频 可读存储介质 解码器
系统为您推荐了相关专利信息
动态图像生成方法 动态图像生成装置 生成参数 元素 列表
深度生成对抗神经网络 激光诱导击穿光谱 扩增方法 样本 谱峰位置
信息展示方法 图片 AI算法 语法结构 GMM模型
随机噪声 噪声图像 对象 复杂度 图像生成方法
光伏面板 数值 参数 图像获取模块 控制无人机