基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统

申请号：CN202510650520

申请日期：2025-05-20

公开号：CN120765980A

公开日期：2025-10-10

类型：发明专利

摘要

本发明公开了基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统，包括采集若干目标检测图像，标记后建立数据集，将数据集输入到改进视觉骨干网络模型进行训练，得到训练好的改进视觉骨干网络模型，改进视觉骨干网络模型包括若干个依次堆叠的特征提取器和特征融合器，特征提取器采用分解的曼哈顿自注意力机制实现特征提取，特征融合器采用未分解的曼哈顿自注意力机制实现特征融合，将待检测图像输入到训练好的改进视觉骨干网络模型，识别待检测图像上的识别目标。本发明能够在不同阶段根据需求灵活地利用曼哈顿自注意力机制的特性，引入显式空间先验，计算成本较低，捕捉图像中的空间信息更强，能充分适应图像数据。

技术关键词

注意力机制特征提取器融合器网络图像识别视觉矩阵标记局部特征提取处理器图像采集模块数据指令识别模块可读存储介质电子设备指数

系统为您推荐了相关专利信息

基于大数据的区域内人员综合管理方法及系统

系统管理模块综合管理系统深度卷积残差网络综合管理方法广义线性模型

基于机器视觉的内镜机器人支架缺陷检测方法

裂缝机器人支架缺陷检测方法内镜支架像素点

一种基于预训练模型和RNA二级结构的RNA G-四链体预测方法和系统

序列特征预训练模型样本全局平均池化 RNA二级结构

一种基于扩散模型的病理切片虚拟染色的图像生成方法

图像生成网络图像生成方法染色病理切片图像预训练语言模型

兼顾中枢调节的双眼不等像检测系统

眼球追踪控制快门式3D眼镜触觉反馈控制尺寸虚拟现实头盔