一种基于FPGA的计算顺序优化的高流水度MambaV2硬件加速系统

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
一种基于FPGA的计算顺序优化的高流水度MambaV2硬件加速系统
申请号:CN202411541460
申请日期:2024-10-31
公开号:CN119474003B
公开日期:2025-10-17
类型:发明专利
摘要
本发明公开了一种基于FPGA的计算顺序优化的高流水度MambaV2硬件加速系统,涉及FPGA和机器学习领域,包括:前级模块、张量扩张模块、隐藏层状态计算模块、输出状态计算模块、残差乘归一化模块和输出线性层模块,将MambaV2算法计算过程分为若干个流水级并采用流水形式输出数据流。本发明不改变原有算法结构,而是改变原算法中隐藏层状态方程的运算顺序,提出优化计算顺序的算法,减少运算次数,降低缓存消耗,实现在FPGA上部署推理MambaV2模型,满足边缘场景部署需求,利用FPGA的定制化加速,通过调整数据流,实现整体算法的流水线设计,提高计算资源的利用率,解决数据阻塞问题,降低计算延时和缓存消耗。
技术关键词
硬件加速系统 归一化模块 模型算法 存储单元 表达式 元素 数据 算法结构 流水线 矩阵 单周期 查表法 乘法器 机制 非线性