基于特征协同与多尺度特征融合的RGB-D语义分割方法

申请号：CN202411561585

申请日期：2024-11-04

公开号：CN119445118A

公开日期：2025-02-14

类型：发明专利

摘要

本发明提供一种基于特征协同与多尺度特征融合的RGB‑D语义分割方法，属于计算机视觉和计算机图形学领域。该方法基于编码器‑解码器的网络结构对图像进行语义分割预测，在网络的每个阶段利用多种注意力机制实现多模态特征校正与融合，优化和增强输入数据的特征表示，并在解码器中使用自顶向下多尺度特征融合策略。通过多种注意力机制，模型能够有效捕捉全局特征与局部特征，实现同一尺度下不同模态信息的融合，并促进不同尺度下特征的精细聚合。本发明应用多种注意力机制实现多模态特征的协同与多尺度特征的融合，有效解决了RGB和深度信息之间的差异、数据中的噪声干扰，以及网络提取过程中细节信息的丢失问题。

技术关键词

语义分割方法多尺度特征融合交叉注意力机制融合特征解码器通道注意力机制双分支网络多模态特征融合策略多尺度特征提取计算机图形学校正特征特征提取模块阶段计算机视觉