清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练 清华SageAttention3,FP4量化5倍加速!且首次支持8比特训练 关键词: SageAttention,模型训练,SageAttention3,注意力算子 随着大型模型需要处理的序列长度不断增加,注意力运算(Attention)的时间开销逐渐成为主要开销。 来自主题: AI技术研报 7032 点击 2025-06-19 10:47