基于特征协同与多尺度特征融合的RGB-D语义分割方法
申请号:CN202411561585
申请日期:2024-11-04
公开号:CN119445118A
公开日期:2025-02-14
类型:发明专利
摘要
本发明提供一种基于特征协同与多尺度特征融合的RGB‑D语义分割方法,属于计算机视觉和计算机图形学领域。该方法基于编码器‑解码器的网络结构对图像进行语义分割预测,在网络的每个阶段利用多种注意力机制实现多模态特征校正与融合,优化和增强输入数据的特征表示,并在解码器中使用自顶向下多尺度特征融合策略。通过多种注意力机制,模型能够有效捕捉全局特征与局部特征,实现同一尺度下不同模态信息的融合,并促进不同尺度下特征的精细聚合。本发明应用多种注意力机制实现多模态特征的协同与多尺度特征的融合,有效解决了RGB和深度信息之间的差异、数据中的噪声干扰,以及网络提取过程中细节信息的丢失问题。
技术关键词
语义分割方法
多尺度特征融合
交叉注意力机制
融合特征
解码器
通道注意力机制
双分支网络
多模态特征
融合策略
多尺度特征提取
计算机图形学
校正特征
特征提取模块
阶段
计算机视觉