一种基于去偏变分推断提示调优的图像识别方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于去偏变分推断提示调优的图像识别方法
申请号:CN202510012396
申请日期:2025-01-06
公开号:CN119418137B
公开日期:2025-03-18
类型:发明专利
摘要
本发明公开了一种基于去偏变分推断提示调优的图像识别方法,属于人工智能和计算机视觉领域。本发明将CLIP作为基准框架,该基准框架包括一个图像分支、一个文本分支;本发明基于图像分支,设计一种基于风格扰动的图像编码器,获得去偏的视觉特征;基于去偏的视觉特征和文本分支,设计一种基于去偏变分推断的文本编码器,获得去偏的文本特征;并通过设计的一种基于变分推断的损失函数,将训练集数据通过基于变分推断的损失函数最小化优化模型参数,得到参数最优的模型;将测试图像数据输入参数最优的模型得到图像识别结果。本发明为数据稀缺或受限场景提供了一种通用的小样本图像识别方法,在有限数据下仍能保持较高的识别准确率和泛化性能。
技术关键词
训练图像数据 令牌 视觉特征 图像编码器 图像识别方法 文本编码器 风格 分支 压缩图像数据 训练集数据 参数 样本 基准 图像块 框架 标签