基于序贯三支掩码和注意力融合的Transformer解释方法

申请号：CN202411133754

申请日期：2024-08-19

公开号：CN119152253A

公开日期：2024-12-17

类型：发明专利

摘要

本发明提供了一种基于序贯三支掩码和注意力融合的Transformer解释方法，属于人工智能可解释性技术领域。解决了Transformer模型解释困难导致难以投入现实应用的技术问题，其技术方案为：首先将图像输入标准的Transformer模块，保存每一层编码器层的注意力矩阵，并聚合生成关系矩阵；接下来取出最终编码器层输出，重塑并上采样作为掩码放入掩码集；接着利用序贯三支决策选出积极掩码集，并获取初步解释结果；最后，将第一步聚合的生成关系矩阵与初步解释结果融合生成最终解释结果。本发明的有益效果为：解释效果好，对自然图像和医学图像均可得到较好的解释结果，帮助人类理解深度学习模型。

技术关键词

注意力编码器序贯三支决策图像块生成关系物体位置信息投影变换矩阵深度学习模型信息编码模块语义上采样线性尺寸医学网格

系统为您推荐了相关专利信息

探针接触阻抗实时监测与补偿方法、装置及存储介质

阻抗实时监测探针结构深度学习神经网络接触电阻值补偿基准数据

一种基于多模态图像的轻量级目标检测方法和系统

Sigmoid函数加权特征多模态可见光图像光照

一种基于时序分解与多维度特征交互的岩心渗透率预测方法

格子玻尔兹曼方法融合特征二值化图像立方体通道

一种山区地表大气能见度反演方法、系统及计算机设备

能见度山区地表雾区反演方法 BP神经网络

声学事件定位方法、装置、系统和计算机可读存储介质

数据处理子系统事件定位方法球形麦克风阵列多模态计算机可执行指令