摘要
双向融合6D物体位姿估计方法,解决了在位姿估计时传感器噪声干扰影响网络性能,鲁棒性较差的问题,属于物体位姿估计领域。本发明提供一种基于新型transformer架构的双向融合6D物体位姿估计方法:对待估计场景的RGB图像与深度图像进行预处理,将深度图像转换成点云数据;利用特征提取层提取RGB图像中的外观特征和点云数据中的几何特征;双向特征融合层集成在特征提取层的每一个维度内;自适应MOE层根据特征提取层最后输出的特征判断主导模态,调整外观特征和几何特征的权重,得到MOE特征,并与特征提取层最后输出的外观特征和几何特征进行拼接,拼接后输入至6D物体位姿估计层得到每个物体的6D位姿参数。