摘要
本发明公开一种基于鸟瞰视图的多点位雷达相机融合检测方法,通过构建改进BEVDepth网络模型,利用稀疏但精确的雷达点,引入雷达辅助视图转换方法RVT将透视视图图像特征转换为鸟瞰视图BEV,弥补图像在深度感知上的不足,并为自动驾驶系统提供更加全面的空间理解。使用多模态可变形注意力机制,进一步聚合BEV中的图像与雷达特征图,旨在消除不同传感器数据之间的空间错位,从而提高感知精度。在采用BEVDepth模型的基础上,对其训练、主干网络和主干网络末端进行了改进,融合雷达数据,增强网络的域不变性,增加了系统对3D目标的识别能力。