一种用于神经网络加速器的高并行度存储架构

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种用于神经网络加速器的高并行度存储架构
申请号:CN202411891417
申请日期:2024-12-20
公开号:CN119624751A
公开日期:2025-03-14
类型:发明专利
摘要
本发明公开了一种用于神经网络加速器的高并行度存储架构,包括:卷积神经网络的第一层输入模块接收原始图片数据;输入数据模块负责处理原始数据,将其转换为适合神经网络处理的形式;输入数据模块提供的数据作为权重模块的输入,权重模块提取对任务有用的图片特征。本发明将输入数据模块划分为分区组、单元组和基本单元,权重模块的层级结构划分为权重模块分区组和权重模块基本单元;同时对卷积神经网络的第一层输入进行拆分。本发明能够将单个输入通道拆分为多个通道,从而提高首层的计算并行度,避免计算资源和存储资源的浪费。本发明采用多单元多分区的数据存储技术,能够快速访问不同通道和不同大小的输入图像数据。
技术关键词
神经网络加速器 数据模块 通道 输入模块 图片 数据存储技术 尺寸 多分区 多单元 层级 代表 滤波器 图像 单层 模式 参数