AI资讯新闻榜单内容搜索-FlashAtten

FlashAttention-4震撼来袭，原生支持Blackwell GPU，英伟达的护城河更深了？

在正在举办的半导体行业会议 Hot Chips 2025 上，TogetherAI 首席科学家 Tri Dao 公布了 FlashAttention-4。

来自主题: AI技术研报

7052 点击 2025-08-27 12:16

清华大学朱军教授团队提出SageAttention3，利用FP4量化实现推理加速，比FlashAttention快5倍，同时探索了8比特注意力用于训练任务的可行性，在微调中实现了无损性能。

来自主题: AI技术研报

7299 点击 2025-07-08 12:08

来自主题: AI技术研报

9784 点击 2024-10-19 14:15

用 FlexAttention 尝试一种新的注意力模式。

来自主题: AI资讯

8606 点击 2024-08-10 18:05

740 TFLOPS！迄今最强 FlashAttention 来了。

来自主题: AI技术研报

9431 点击 2024-07-12 17:45

时隔一年，FlashAttention又推出了第三代更新，专门针对H100 GPU的新特性进行优化，在之前的基础上又实现了1.5～2倍的速度提升。

来自主题: AI技术研报

9431 点击 2024-07-12 16:57

大模型训练推理神作，又更新了！

来自主题: AI资讯

9530 点击 2024-07-12 15:39

AI算力资源越发紧张的当下，斯坦福新研究将GPU运行效率再提升一波——

来自主题: AI技术研报

10739 点击 2024-06-06 18:02

Hyena处理长序列输入比FlashAttention速度高100倍！最新发布的StripedHyena模型可能成下一代AI架构的新标准？

来自主题: AI资讯

7480 点击 2024-01-02 14:57

这两天，FlashAttention团队推出了新作：一种给Transformer架构大模型推理加速的新方法，最高可提速8倍。该方法尤其造福于长上下文LLM，在64k长度的CodeLlama-34B上通过了验证

来自主题: AI技术研报

4208 点击 2023-10-18 14:43