摘要
本说明书实施例公开了一种数据筛选方法、装置、存储介质及设备,获取到执行业务所需的视觉数据后,针对视觉数据中的每个图像,现将该图像划分为多个子图并得到子图的图像特征,基于图像特征构建各子图为节点的图数据,利用图数据中连接关系以及图像特征,确定每个节点对应子图携带的信息量,基于信息量筛选出用于输入多模态大模型的数据,以根据模型输出结果执行业务。利用图数据表征子图之间关系,确定每个子图携带信息量的多少以及筛选出关键的子图,大大降低了模型令牌计算量。降低冗余并不会导致精度下降,使得实际业务中视觉数据的可用性大大提高,且仍能保持输出结果的精度。