应用于边缘设备的推理加速方法、装置及电子设备

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
应用于边缘设备的推理加速方法、装置及电子设备
申请号:CN202511113382
申请日期:2025-08-08
公开号:CN120633870B
公开日期:2025-11-18
类型:发明专利
摘要
本申请提供应用于边缘设备的推理加速方法、装置及电子设备。本申请通过将预训练模型的权重矩阵N个权重子块,将预训练模型的激活矩阵划分为M个激活子块,以对预训练模型中权重子块以及该权重子块对应的激活子块进行量化处理,得到目标模型;若至少两个权重子块的量化位宽相同,则基于该至少两个权重子块对应的权重值量化超参以及各权重子块对应的激活子块对应的激活值量化超参,将该至少两个权重子块作为一个整体进行量化处理。其中,将相同量化位宽的权重子块以及对应的激活子块进行了整体处理,在加载这些子块时,内存访问模式从随机跳变变换为顺序读写,同时对权重值和激活值进行了量化,提高了模型的推理速度,降低了模型占用的存储空间。
技术关键词
矩阵 机器可读存储介质 预训练模型 内存访问模式 电子设备 处理单元 加速装置 物理 处理器 通道 尺寸 指令 速度