基于跨模态空间超点的人车交互三维分割方法

申请号：CN202511241567

申请日期：2025-09-02

公开号：CN120747520B

公开日期：2025-11-04

类型：发明专利

摘要

本发明公开了一种基于跨模态空间超点的人车交互三维分割方法，包括以下步骤：步骤S1、文本特征编码器编码文本语言信息；步骤2、点云特征编码与超点生成；步骤3、超点几何特征融合；步骤4、分层特征匹配；步骤5、损失计算与训练。本发明的基于跨模态空间超点的人车交互三维分割方法，在人车交互与智能驾驶中，通过语言文本和点云的多模态融合，实现视觉特征信息与文本特征信息的匹配。通过文本和点云编码器经过归一化后统一特征尺度后输出具有语义和几何一致性的超点集合，分割并理解场景中的用户语言描述的对象，从而实现人车交互、智能导航、安全避障等。

技术关键词

三维分割方法文本特征向量跨模态三维点云数据网格特征多层注意力机制视觉特征信息编码器语义融合特征更新网络参数注意力模型人车交互分层特征点云特征词特征