图像分类方法、电子设备及计算机可读存储介质

申请号：CN202411112237

申请日期：2024-08-14

公开号：CN119206294A

公开日期：2024-12-27

类型：发明专利

摘要

本申请实施例提供了一种图像分类方法、电子设备及计算机可读存储介质，涉及人工智能技术领域。该方法包括：将第一样本图像输入预训练视觉语言模型进行文本生成，得到第一样本图像文本描述；为第一样本图像文本描述增加问题引导语，然后输入第一初始大语言模型进行类别预测，得到第一样本预测图像类别；基于真实图像类别和第一样本预测图像类别对初始大语言模型进行微调，得到第一目标大语言模型；将第一目标图像输入预训练视觉语言模型进行文本生成，得到第一目标图像文本描述；为第一目标图像文本描述增加问题引导语，然后输入第一目标大语言模型进行类别预测，得到第一目标预测图像类别。本申请提高了图像分类准确性。

技术关键词

图像类别大语言模型样本预测类别图像分类方法视觉标签模型字幕预训练语言模型可读存储介质电子设备标签模板标签文本人工智能技术生成标签数据