用于过滤图文数据的方法、系统和存储介质
# 热门搜索 #
大模型
人工智能
openai
融资
chatGPT
AITNT公众号
AITNT APP
AITNT交流群
搜索
首页
AI资讯
AI技术研报
AI监管政策
AI产品测评
AI商业项目
AI产品热榜
AI专利库
寻求报道
用于过滤图文数据的方法、系统和存储介质
申请号:
CN202510166990
申请日期:
2025-02-14
公开号:
CN120562590A
公开日期:
2025-08-29
类型:
发明专利
摘要
本公开描述了用于过滤图文数据的技术。对多个图像‑文本对质量评分任务构建指令数据。使用所构建的指令数据将机器学习模型微调为图像‑文本数据过滤器。通过经微调的机器学习模型并使用多个度量来评估来自数据集的每个图像‑文本对的质量。多个度量包括图像‑文本匹配ITM度量、对象细节履行ODF度量和图像说明文本质量CTQ度量。基于多个度量中的一个或多个度量,从数据集中选择高质量的图像‑文本对。
技术关键词
文本
图像
度量
机器学习模型评估
数据
计算机可读指令
教师
可读存储介质
图文
过滤器
处理器
对象
视觉
存储器