摘要
本发明公开了一种基于跨模态空间超点的人车交互三维分割方法,包括以下步骤:步骤S1、文本特征编码器编码文本语言信息;步骤2、点云特征编码与超点生成;步骤3、超点几何特征融合;步骤4、分层特征匹配;步骤5、损失计算与训练。本发明的基于跨模态空间超点的人车交互三维分割方法,在人车交互与智能驾驶中,通过语言文本和点云的多模态融合,实现视觉特征信息与文本特征信息的匹配。通过文本和点云编码器经过归一化后统一特征尺度后输出具有语义和几何一致性的超点集合,分割并理解场景中的用户语言描述的对象,从而实现人车交互、智能导航、安全避障等。