一种基于注意力与CNN的高效单目深度估计方法及系统
申请号:CN202510785081
申请日期:2025-06-12
公开号:CN120599014A
公开日期:2025-09-05
类型:发明专利
摘要
本发明属于计算机视觉技术领域,具体的说是一种基于注意力与CNN的高效单目深度估计方法及系统,系统网络架构包括:编码器,采用级联方式对Transformer分支模块和轻量化CNN分支模块进行融合;融合模块能够聚合CNN层的局部特征与来自Transformer层的全局特征;特征金字塔模块其利用多尺度特征融合和自顶向下与横向连接进行特征聚合;解码器采用轻量化加性注意力机制来实现编码多尺度特征和解码模块的融合;Bins预测模块通过将深度范围划分为多个区间实现深度的分类回归;本发明网络聚合Transformer的长程相关性和轻量化CNN的局部特征提取能力,在深度预测时结合局部细节和远距离关系实现精准预测。
技术关键词
瓶颈特征
单目深度估计方法
多尺度特征融合
特征金字塔
注意力机制
上采样
分支
卷积模块
解码模块
解码器
级联方式
高层语义信息
种子
网络架构
局部特征提取
编码器特征