数据处理方法、图像文本数据质量增强模型的训练方法及设备
申请号:CN202411471900
申请日期:2024-10-21
公开号:CN119495001A
公开日期:2025-02-21
类型:发明专利
摘要
本申请实施例提供的一种数据处理方法、图像文本数据质量增强模型的训练方法及设备,包括:获取图像及初始描述信息,并输入至图像文本数据质量增强模型,得到模型的输出结果;图像文本数据质量增强模型用于根据图像及初始描述信息得到评估信息,在评估信息指示初始描述信息与图像匹配度低时,基于图像生成图像的增强描述信息,将增强描述信息及评估信息作为输出结果;在评估信息指示初始描述信息与图像匹配度高时,将评估信息作为输出结果。若输出结果为评估信息,将图像及初始描述信息确定为MLLM模型的训练数据;若输出结果为评估信息及图像的增强描述信息,将图像及增强描述信息确定为MLLM模型的训练数据。用以增强数据质量,提高数据的利用率。
技术关键词
文本
样本
图像匹配
数据处理方法
处理单元
大语言模型
模型更新
可读存储介质
计算机程序指令
多模态
存储计算机程序
数据处理装置
多层感知机
训练装置
电子设备
处理器