摘要
本发明提出了一种跨维度分支的自动驾驶语义占用率预测方法,该方法专门针对从2D图像中高效提取特征并随后将其投影到高维空间进行了优化,能够更有效地将图像数据转换为3D体素表示,显著提高语义占用预测的准确性。其主要由五个部分构成:(1)采用ImageEncoder组件对输入的RGB图像进行特征提取;(2)采用ImageTrans组件将2D图像特征提取到3D环境中并保持通道效率;(3)采用View Transformation模块对输入图像的特征进行转换;(4)采用XDB‑BEVStream模块细化体素特征;(5)采用集成损失函数套件提高模型的性能。本发明使用SemanticKITTI和nuScenes数据集验证,与最先进的SOTA方法相比较,XDB‑Occ框架在语义占用预测方面明显优于它。