一种基于分组细粒度结构化剪枝的视觉Transformer加速器

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于分组细粒度结构化剪枝的视觉Transformer加速器
申请号:CN202510992709
申请日期:2025-07-18
公开号:CN121009925A
公开日期:2025-11-25
类型:发明专利
摘要
本发明公开一种基于分组细粒度结构化剪枝的视觉Transformer加速器,属于计算、推算或计数的技术领域。本发明通过基于增量的M:8分组细粒度结构化剪枝和整型量化,轻量化模型的硬件资源需求;提供了一种针对轻量化算法的专用硬件计算电路,该硬件计算电路包括存储模块、自注意力机制矩阵计算模块以及控制模块,涉及专用计算单元与稀疏解码单元设计、基于改进的输入固定数据流的及脉动计算阵列设计等。本发明提出的方法应用较为简单,针对视觉Transformer模型具有较好的加速效果,并且硬件加速电路设计具有较高的计算能效。
技术关键词
数据选择器 加速器 视觉 注意力机制 编码 存储模块 输入端 系数可调 剪枝方法 参数 输出端 加法器 阵列 处理单元 周期 非线性 模式 乘法器 模型剪枝