多层次跨模态协同特征编码器结构

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
多层次跨模态协同特征编码器结构
申请号:CN202410964160
申请日期:2024-07-17
公开号:CN118967468A
公开日期:2024-11-15
类型:发明专利
摘要
本发明聚焦于多模态图像融合领域,提出一种多层次跨模态协同特征编码器结构。步骤1:将红外数据集与可见光数据集进行尺寸归一化处理;步骤2:将红外图像和可见光图像分别输入到Transformer进行初步融合及提取特征;步骤3:将红外图像和可见光图像输入到CNN网络进行融合及提取特征;步骤4:将两种网络提取出的特征通过CBAM模块进行空间和通道注意力加权后融合。在本发明中,针对多模态特征融合效果不佳的问题,将两种网络分别提取特征后通过CBAM模块进行空间和通道注意力加权,有效保留红外图像在低光、夜间等恶劣情况下的热辐射信息和可见光图像的细节和颜色信息,可用于军事侦察、安防系统、医学诊断等领域。
技术关键词
可见光图像 编码器结构 跨模态 多层次 双线性插值 注意力 多模态特征融合 多尺度特征融合 元素 通道 上采样 安防系统 模块 网络 尺寸 训练集