基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统
申请号:CN202510650520
申请日期:2025-05-20
公开号:CN120765980A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统,包括采集若干目标检测图像,标记后建立数据集,将数据集输入到改进视觉骨干网络模型进行训练,得到训练好的改进视觉骨干网络模型,改进视觉骨干网络模型包括若干个依次堆叠的特征提取器和特征融合器,特征提取器采用分解的曼哈顿自注意力机制实现特征提取,特征融合器采用未分解的曼哈顿自注意力机制实现特征融合,将待检测图像输入到训练好的改进视觉骨干网络模型,识别待检测图像上的识别目标。本发明能够在不同阶段根据需求灵活地利用曼哈顿自注意力机制的特性,引入显式空间先验,计算成本较低,捕捉图像中的空间信息更强,能充分适应图像数据。
技术关键词
注意力机制
特征提取器
融合器
网络图像识别
视觉
矩阵
标记
局部特征提取
处理器
图像采集模块
数据
指令
识别模块
可读存储介质
电子设备
指数