一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法
申请号:CN202411849966
申请日期:2024-12-16
公开号:CN119832298A
公开日期:2025-04-15
类型:发明专利
摘要
本申请公开了一种基于视觉大模型的开关闭合识别模型构建方法及开关闭合识别方法,所述开关闭合识别模型构建方法包括:S1:采集开关图像,制作数据集,所述数据集包括:图像文件和标签文件,标签文件中记录对应开关图像的种类和状态;S2:搭建ViT模型,S3:搭建CLIP模型,S4:模型训练;使用CLIP模型训练一个开关种类分类器,使用ViT模型训练一个开关闭合识别分类器;S5:模型融合,将基于CLIP模型的开关种类分类器和基于ViT模型的开关闭合识别分类器进行融合,从而获得开关闭合识别模型。通过本申请实现了在不同开关种类下,高效、准确地识别开关的闭合状态。
技术关键词
识别模型构建方法
分类器
文本编码器
图像编码器
标签文件
编码器模块
识别方法
前馈神经网络
识别开关
图像嵌入
双编码器
视觉
注意力机制
矩阵