机器学习模型的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品
申请号:CN202510322768
申请日期:2025-03-18
公开号:CN120278213A
公开日期:2025-07-08
类型:发明专利
摘要
本申请提供了一种机器学习模型的数据处理方法、装置、电子设备、计算机可读存储介质及计算机程序产品;方法包括:对第一训练集中的多个原始图像样本进行目标识别,将识别到的元素组合为元素集;从元素集中提取多个元素子集,确定元素子集在多个原始图像样本中的出现次数;基于出现次数,从多个元素子集中识别出高频元素子集和低频元素子集中的至少一种;基于高频元素子集和低频元素子集中的至少一个进行文本生成,得到第一生成式文本样本;基于第一生成式文本样本进行图像生成,得到生成式图像样本,其中,第一生成式文本样本和生成式图像样本用于训练机器学习模型。通过本申请,能够提高机器学习模型的准确性。
技术关键词
样本
元素
文本
图像
数据处理方法
计算机可执行指令
训练集
图文
计算机程序产品
数据处理装置
训练机器学习模型
识别模块
可读存储介质
电子设备
数据获取模块
处理器