图像分类方法、电子设备及计算机可读存储介质

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
图像分类方法、电子设备及计算机可读存储介质
申请号:CN202411112237
申请日期:2024-08-14
公开号:CN119206294A
公开日期:2024-12-27
类型:发明专利
摘要
本申请实施例提供了一种图像分类方法、电子设备及计算机可读存储介质,涉及人工智能技术领域。该方法包括:将第一样本图像输入预训练视觉语言模型进行文本生成,得到第一样本图像文本描述;为第一样本图像文本描述增加问题引导语,然后输入第一初始大语言模型进行类别预测,得到第一样本预测图像类别;基于真实图像类别和第一样本预测图像类别对初始大语言模型进行微调,得到第一目标大语言模型;将第一目标图像输入预训练视觉语言模型进行文本生成,得到第一目标图像文本描述;为第一目标图像文本描述增加问题引导语,然后输入第一目标大语言模型进行类别预测,得到第一目标预测图像类别。本申请提高了图像分类准确性。
技术关键词
图像类别 大语言模型 样本 预测类别 图像分类方法 视觉 标签模型 字幕 预训练语言模型 可读存储介质 电子设备 标签模板 标签文本 人工智能技术 生成标签 数据