摘要
本发明公开了一种基于图像和点云融合的三维目标检测方法。该方法可以结合图像和点云两种不同的模态信息,在三维场景中识别和定位目标物体,实现精确和鲁棒的三维目标检测。在原有MVX‑Net模型的基础上,将图像分支的骨干网络替换为ResNeXt‑50,提高对图像特征的提取能力,并将最后两个卷积阶段的普通3*3卷积更改为可变形卷积DC Nv2,更好地适应不同形状和位置的目标,提高模型的鲁棒性和泛化能力;在颈部网络中,对输入的每个特征图添加CBAM注意力,提高网络的精度和稳定性;在图像和点云的融合阶段,采用自适应融合的方式,使得融合更加充分和有效。本发明相比于原有的MVX‑Ne t精度更高,稳定性更好。