多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品
申请号:CN202411863896
申请日期:2024-12-16
公开号:CN119693713A
公开日期:2025-03-25
类型:发明专利
摘要
本公开提供了一种多模态大模型的训练、图像分类方法及装置、智能体、设备、介质和产品,涉及人工智能技术领域,尤其涉及计算机视觉、深度学习、大模型等技术领域,可应用于多模态识别和分类场景。该多模态大模型的训练方法包括:获取训练样本集,其中,训练样本集包括多个训练样本对,每个训练样本对包括样本图像、样本文本和用于样本图像的类别描述;将每个训练样本对分别输入至待训练的大模型,得到每个样本图像各自的类别信息;以及,利用每个训练样本对各自的类别描述和类别信息,训练待训练的大模型,得到用于图像分类的多模态大模型。
技术关键词
多模态 训练样本集 融合特征 文本 图像特征提取 图像分类方法 特征提取模块 大语言模型 标记 输入模块 图像分类装置 分类场景 人工智能技术 计算机程序产品 处理器 计算机视觉