一种基于多模态大模型的点云全景分割方法、系统及设备
申请号:CN202410909723
申请日期:2024-07-09
公开号:CN118470329B
公开日期:2024-10-01
类型:发明专利
摘要
本发明涉及点云全景分割领域,提供了一种基于多模态大模型的点云全景分割方法、系统及设备。该方法包括获取点云数据和描述点云场景的文本;基于文本数据,采用文本编码器,得到文本嵌入特征;基于描述点云场景的文本,采用点云编码器,得到点云嵌入特征;将文本嵌入特征和点云嵌入特征输入至多模态理解适配器中,得到文本特征和点云特征;将文本特征和点云特征融合,得到融合特征;在多模态大模型中每间隔设定个的隐藏层引入融合特征进行多模态融合,得到全景特征;将全景特征输入至解码器中,得到全景分割结果。本发明结合图像、文本等模态的信息可以帮助算法更准确地识别点云中的不同全景,并减少误分割和漏分割的情况。
技术关键词
记忆
全景分割方法
嵌入特征
多模态
融合历史
注意力
融合特征
点云
适配器
矩阵
分割系统
文本编码器
视频帧特征
冗余
解码器
线性
压缩算法
聚类算法
损失函数优化