摘要
本发明涉及图像处理技术领域,公开了一种图像数据集构建方法及系统,本方法包括利用多模态大模型CLIP识别现有图像数据集的缺陷,并进行补充;对补充后得到的图像数据集进行标注,并通过多层次的质量控制确保标注的准确性;对标注完成的图像数据集进行扩展;将扩展后得到的图像数据集与其他模态数据进行融合,完成最终图像数据集的构建。本发明提高了数据采集的精准性和标注的效率,提高了数据标注的准确性和一致性,减少了人为错误;本发明能够动态扩展数据集,使得数据集更加多样化,模型的泛化能力得以提升;本发明支持图像与其他模态的融合,利用大模型的跨模态对齐能力,增强了图像数据集的应用场景与灵活性。