基于内存增强和软掩膜的多波段图像自动描述方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于内存增强和软掩膜的多波段图像自动描述方法
申请号:CN202410822066
申请日期:2024-06-25
公开号:CN118736576A
公开日期:2024-10-01
类型:发明专利
摘要
本发明涉及图像描述方法和图像融合方法,尤其涉及多波段图像自动描述方法,具体为基于内存增强和软掩膜的多波段图像自动描述方法。将可见光图像特征、红外图像特征以及文本特征置于同一表征层级,在传统Transformer的基础上,构建内存增强模块用于存储多波段图像特征间的内在相关性以及语言上下文信息;同时,利用软掩膜机制筛选有效的视觉特征向量以及内存中存储的特征向量,以确保模型精确聚焦于关键视觉信息或语言上下文信息,可用于安防监控和军事侦察等复杂场景理解。
技术关键词
内存 红外图像特征 可见光图像 掩膜 多波段 多模态特征 关键视觉信息 图像融合方法 多头注意力机制 文本 解码器 阶段 输出特征 自然语言 指标 标记