基于序贯三支掩码和注意力融合的Transformer解释方法
申请号:CN202411133754
申请日期:2024-08-19
公开号:CN119152253A
公开日期:2024-12-17
类型:发明专利
摘要
本发明提供了一种基于序贯三支掩码和注意力融合的Transformer解释方法,属于人工智能可解释性技术领域。解决了Transformer模型解释困难导致难以投入现实应用的技术问题,其技术方案为:首先将图像输入标准的Transformer模块,保存每一层编码器层的注意力矩阵,并聚合生成关系矩阵;接下来取出最终编码器层输出,重塑并上采样作为掩码放入掩码集;接着利用序贯三支决策选出积极掩码集,并获取初步解释结果;最后,将第一步聚合的生成关系矩阵与初步解释结果融合生成最终解释结果。本发明的有益效果为:解释效果好,对自然图像和医学图像均可得到较好的解释结果,帮助人类理解深度学习模型。
技术关键词
注意力
编码器
序贯三支决策
图像块
生成关系
物体位置信息
投影变换矩阵
深度学习模型
信息编码
模块
语义
上采样
线性
尺寸
医学
网格