一种支持大模型推理过程上下文信息安全保存和恢复的硬件系统、方法及应用

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种支持大模型推理过程上下文信息安全保存和恢复的硬件系统、方法及应用
申请号:CN202411033076
申请日期:2024-07-30
公开号:CN118963663B
公开日期:2025-07-08
类型:发明专利
摘要
本发明公开了一种支持大模型推理过程中上下文信息安全保存和恢复的硬件系统,所述硬件系统包括:推理主机和存储系统;所述推理主机通过USB接口与所述存储系统进行通讯;所述推理主机中包括:内存、中央处理器、硬盘、GPU/NPU/TPU模块;所述存储系统中包括:ARM Cortex‑M7芯片、DMA/FIFO模块、SDMMC接口、USART接口、GPIO接口;所述存储系统通过SDMMC接口挂载Flash存储芯片,用于保存大模型推理过程中的K、V矩阵数据;所述存储系统和所述Flash存储芯片或所述推理主机和所述存储系统之间采用USB 3.0和/或SDIO 3.0UHS‑2协议进行数据传输。本发明还公开了一种上下文信息保存和恢复方法及应用。
技术关键词
存储系统 FIFO模块 硬件系统 USB接口 存储芯片 恢复方法 主机 大语言模型 GPIO接口 USB驱动程序 数据加载速率 硬件装置 USB开关 上下文保存 中央处理器 内存