用于过滤图文数据的方法、系统和存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
用于过滤图文数据的方法、系统和存储介质
申请号:CN202510166990
申请日期:2025-02-14
公开号:CN120562590A
公开日期:2025-08-29
类型:发明专利
摘要
本公开描述了用于过滤图文数据的技术。对多个图像‑文本对质量评分任务构建指令数据。使用所构建的指令数据将机器学习模型微调为图像‑文本数据过滤器。通过经微调的机器学习模型并使用多个度量来评估来自数据集的每个图像‑文本对的质量。多个度量包括图像‑文本匹配ITM度量、对象细节履行ODF度量和图像说明文本质量CTQ度量。基于多个度量中的一个或多个度量,从数据集中选择高质量的图像‑文本对。
技术关键词
文本 图像 度量 机器学习模型评估 数据 计算机可读指令 教师 可读存储介质 图文 过滤器 处理器 对象 视觉 存储器