一种基于Transformer的低空无人机多视感知方法
申请号:CN202511508874
申请日期:2025-10-22
公开号:CN120976810A
公开日期:2025-11-18
类型:发明专利
摘要
本申请公开了一种基于Transformer的低空无人机多视感知方法,属于图像处理技术领域,包括:获取多个相机拍摄的图像;采用Depth Anything作为基础单目深度估计模型,获得每个图像对应的相对深度图,并采用视角自监督深度校正机制VAST校正相对深度图;基于校正后的相对深度图,利用Transformer驱动的动态尺度融合模型TDSF,将视觉深度与导航信息通过Transformer融合,动态估计得到最优尺度因子,并基于最优尺度因子,得到绝对深度图;基于绝对深度图,利用动态空间自注意力的稀疏视角BEV融合模型DSSA转换为BEV表征,得到最终的BEV特征图。该方法提高了三维感知的准确度。
技术关键词
低空无人机
深度图
导航传感器
因子
相机
注意力
校正机制
单目深度估计
坐标
矩阵
网络单元
深度值
动态
像素点
视角
图像
邻域
前馈神经网络