一种基于交叉自注意力与特征归纳的多模态融合方法

申请号：CN202510425692

申请日期：2025-04-07

公开号：CN120339771A

公开日期：2025-07-18

类型：发明专利

摘要

一种基于交叉自注意力与特征归纳的多模态融合方法，包括以下步骤：获取道路目标的LiDAR特征数据与图像特征数据，并对LiDAR特征数据进行预处理；将预处理后的LiDAR特征数据与图像特征数据并行输入预先训练的融合网络模型，获得道路目标检测结果；融合网络模型包括：多模态特征交互处理、全局特征学习处理和特征归纳处理，多模态特征交互处理通过跨模态注意力机制加强特征交互，弥合语义差异；全局特征学习处理利用自注意力机制对融合特征进行全局感知和重映射，增强全局语义特征学习，特征归纳引入归纳偏置，加速Transformer架构收敛，通过三责协同工作，网络能更好地捕捉模态间的深层次交互，增强特征关联，并对融合特征进行全局学习，从而提升模型的语义推理能力。

技术关键词

图像特征数据融合方法平衡特征融合特征交叉注意力机制多模态交互图像增强融合图像特征跨模态多模态特征级联网络存储计算机程序计算机系统阶段语义特征