利用3D注意力机制的视频生成模型的加速方法及加速器

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
利用3D注意力机制的视频生成模型的加速方法及加速器
申请号:CN202510650052
申请日期:2025-05-20
公开号:CN120547415A
公开日期:2025-08-26
类型:发明专利
摘要
本发明公开了一种利用3D注意力机制的视频生成模型的加速方法及加速器,该方法中,进行注意力计算过程包括:采用规约推测方式检验注意力计算中的重要部分,对于重要部分采用FP‑FP的方式计算矩阵乘法,对于非重要部分采用FP‑INT的方式计算矩阵乘法;采用FP‑INT的方式计算矩阵乘法的过程中,混合计算引擎通过查表的方式获取浮点数尾数与整形的乘积。通过基于推测的相似性检测方法和缓存查找表架构,显著减少了注意力计算的冗余操作,将原注意力计算过程中超过65%的高开销FP‑FP计算替换为低开销的FP‑INT计算,逼近提高了效率,还降低了视频生成过程中的能耗,使得大规模视频生成任务更加经济高效。
技术关键词
视频生成模型 矩阵 注意力机制 浮点数 推测方式 相似性检测方法 加速器 查表乘法器 查找表架构 索引表 处理单元 数值 因子 表达式 冗余 指数 能耗 指标