基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统
申请号:CN202510650520
申请日期:2025-05-20
公开号:CN120765980A
公开日期:2025-10-10
类型:发明专利
摘要
本发明公开了基于曼哈顿自注意力的视觉骨干网络图像识别方法及系统,包括采集若干目标检测图像,标记后建立数据集,将数据集输入到改进视觉骨干网络模型进行训练,得到训练好的改进视觉骨干网络模型,改进视觉骨干网络模型包括若干个依次堆叠的特征提取器和特征融合器,特征提取器采用分解的曼哈顿自注意力机制实现特征提取,特征融合器采用未分解的曼哈顿自注意力机制实现特征融合,将待检测图像输入到训练好的改进视觉骨干网络模型,识别待检测图像上的识别目标。本发明能够在不同阶段根据需求灵活地利用曼哈顿自注意力机制的特性,引入显式空间先验,计算成本较低,捕捉图像中的空间信息更强,能充分适应图像数据。
技术关键词
注意力机制 特征提取器 融合器 网络图像识别 视觉 矩阵 标记 局部特征提取 处理器 图像采集模块 数据 指令 识别模块 可读存储介质 电子设备 指数
系统为您推荐了相关专利信息
系统管理模块 综合管理系统 深度卷积残差网络 综合管理方法 广义线性模型
裂缝 机器人支架 缺陷检测方法 内镜支架 像素点
序列特征 预训练模型 样本 全局平均池化 RNA二级结构
图像生成网络 图像生成方法 染色 病理切片图像 预训练语言模型
眼球追踪控制 快门式3D眼镜 触觉反馈控制 尺寸 虚拟现实头盔