三维堆叠存算一体化移动人工智能加速系统及推理方法

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
三维堆叠存算一体化移动人工智能加速系统及推理方法
申请号:CN202511348880
申请日期:2025-09-19
公开号:CN120996203A
公开日期:2025-11-21
类型:发明专利
摘要
本申请涉及三维堆叠存算一体化人工智能加速系统及推理方法,包括:三维堆叠存储模块,其包括多个通过高密度垂直互连结构进行通信的垂直堆叠的DRAM层;计算单元阵列,其通过三维集成技术与三维堆叠存储模块的至少一层进行直接通信耦合,并被配置为执行大型语言模型或多模态大型语言模型的至少部分推理计算;以及预存储键值缓存管理模块,该模块被配置为:在三维堆叠存储模块的一个或多个指定物理区域内,预先存储有由预定义的系统提示词经预填充计算后生成的键值缓存;计算单元阵列被进一步配置为:在执行所述推理计算时,访问预存储的键值缓存,并将其与根据动态用户输入生成的数据相结合,从而避免对系统提示词进行重复的预填充计算。
技术关键词
加速系统 键值 存储模块 推理方法 三维集成技术 模板 垂直互连结构 非暂时性计算机可读存储介质 动态 阵列 注意力机制 加载控制器 增量更新 高密度 索引表 核心 数据通信 矩阵
系统为您推荐了相关专利信息
结构检测装置 结构检测系统 分布式光纤 光纤传感器 云端服务器
智能检测方法 隧道 构建深度神经网络 三维激光扫描仪 点云
可信存储系统 指令 生命周期管理 调度终端 存储模块
气象 状态空间模型 中央处理器执行 单片机设备 矩阵
动态可视化 数据处理模块 MongoDB数据库 数据存储模块 点云数据处理