基于注意力的神经网络

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
基于注意力的神经网络
申请号:CN202510327244
申请日期:2025-03-19
公开号:CN120688547A
公开日期:2025-09-23
类型:发明专利
摘要
本文描述了压缩基于注意力的神经网络的计算机实施方法和用于压缩基于注意力的神经网络的处理系统。基于注意力的神经网络包括注意力层。注意力层被布置成根据键矩阵、查询矩阵和值矩阵来实施注意力函数。注意力层被配置成使用键权重矩阵来确定键矩阵,使用查询权重矩阵来确定查询矩阵,且使用值权重矩阵来确定值矩阵。确定与键权重矩阵、查询权重矩阵和值权重矩阵具有相同大小和形状的组合矩阵。对于组合矩阵的每个元素:(i)如果键权重矩阵、查询权重矩阵和值权重矩阵的对应元素为零,那么组合矩阵的元素被确定为零,且(ii)如果键权重矩阵、查询权重矩阵和值权重矩阵的对应元素中的至少一个为非零的,那么组合矩阵的元素被确定为非零的。
技术关键词
矩阵 注意力 超图模型 元素 解码器 计算机可读代码 编码器 顶点 阵列 可读存储介质 处理器 密度 分层 序列