数据处理方法、图像文本数据质量增强模型的训练方法及设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
数据处理方法、图像文本数据质量增强模型的训练方法及设备
申请号:CN202411471900
申请日期:2024-10-21
公开号:CN119495001A
公开日期:2025-02-21
类型:发明专利
摘要
本申请实施例提供的一种数据处理方法、图像文本数据质量增强模型的训练方法及设备,包括:获取图像及初始描述信息,并输入至图像文本数据质量增强模型,得到模型的输出结果;图像文本数据质量增强模型用于根据图像及初始描述信息得到评估信息,在评估信息指示初始描述信息与图像匹配度低时,基于图像生成图像的增强描述信息,将增强描述信息及评估信息作为输出结果;在评估信息指示初始描述信息与图像匹配度高时,将评估信息作为输出结果。若输出结果为评估信息,将图像及初始描述信息确定为MLLM模型的训练数据;若输出结果为评估信息及图像的增强描述信息,将图像及增强描述信息确定为MLLM模型的训练数据。用以增强数据质量,提高数据的利用率。
技术关键词
文本 样本 图像匹配 数据处理方法 处理单元 大语言模型 模型更新 可读存储介质 计算机程序指令 多模态 存储计算机程序 数据处理装置 多层感知机 训练装置 电子设备 处理器
系统为您推荐了相关专利信息
深度学习方法 多通道 手工特征 门控循环单元 独立成分分析算法
精细识别方法 电力数据分析技术 计算机系统 深度学习模型 序列
膜蛋白 多靶点 强度 荧光标记抗体 指数衰减函数
个性化疫苗 卷积神经网络识别 肿瘤突变负荷 闭环反馈系统 风险预测方法
结构化检索方法 节点 模型树 语义向量 向量检索技术