基于双重共享机制的小样本分类方法及系统

申请号：CN202510359579

申请日期：2025-03-25

公开号：CN120259760A

公开日期：2025-07-04

类型：发明专利

摘要

本发明公开了基于双重共享机制的小样本分类方法及系统，涉及计算机视觉技术领域。本发明包括：接收文本及图像信息并进行预处理；构建视觉语言模型，使用损失函数对视觉语言模型进行监督训练，直至收敛，得到训练后的视觉语言模型；训练后的视觉语言模型包括文本编码器与视觉编码器，将预处理后的文本与图像信息输入视觉语言模型中得到文本特征和图像特征。本发明引入了模态间共享系数，促进了文本提示符和视觉提示符之间的深度跨模态交互，增强了视觉语言模型中视觉特征与文本特征的对齐，并且提出了模态内共享矩阵，旨在保持参数和计算效率的同时，进一步优化模型性能，保持了准确性和效率之间的权衡。

技术关键词

样本分类方法文本编码器瓶颈结构适配器机制跨模态注意力样本分类系统图像嵌入矩阵计算机视觉技术岩石识别模型训练模块生成特征视觉特征图像分割