AI资讯新闻榜单内容搜索-GPU

GPU推理时代终结？世界最大芯片加持推理狂飙20倍，英伟达H100也被干趴！

LLM若以每秒1000+token高速推理，当前最先进的GPU根本无法实现！Cerebras Inference一出世，推理速度赶超英伟达GPU，背靠自研的世界最大芯片加持。而且，还将推理价格打了下来。

来自主题: AI资讯

5872 点击 2024-08-28 18:16

百万卡AI集群，离不开英伟达网络

马斯克xAI建超算集群，以太网助AI云迅猛发展。

来自主题: AI资讯

5378 点击 2024-08-22 17:38

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

本期我们邀请到了纽约大学计算机科学院博士童晟邦带来【多模态大模型：视觉为中心的探索】的主题分享。

来自主题: AI技术研报

11536 点击 2024-08-21 10:39

“印度马斯克”要发印度第一款 AI 芯片，号称超越英伟达，CEO 要“狼性”，但把数十亿美元打水漂

AI市场迎来又一位新玩家。

来自主题: AI资讯

6254 点击 2024-08-20 09:43

强攻GPU，TPU芯片一夜蹿红

AI芯片的竞争，又多了几分看点。

来自主题: AI资讯

5852 点击 2024-08-19 10:21

买不起英伟达“特供”，中国创业者偏爱4090

大模型进入推理阶段，性价比压过算力。

来自主题: AI资讯

9183 点击 2024-08-14 10:43

论文荣登计算机体系结构顶会ISCA，芯片架构成为边缘AI最佳并行计算选择

AI 大模型的爆发带动了 GPU 的强劲需求，从云端到边缘渗透的 AI 应用也将带动边缘 AI 服务器及加速处理器的需求。

来自主题: AI资讯

5704 点击 2024-08-13 17:53

喧嚣背后，国产GPU距离“平替”英伟达还有多远?

2024年上海的7月是一个沉闷的雨季，但对国产AI 行业来说，却迎来了堪比摇滚乐集会的WAIC（世界人工智能大会）。

来自主题: AI资讯

8364 点击 2024-08-12 17:38

把两块芯片压成一块：EUV以来半导体制造的最大创新

在一平方毫米的硅片上建立数百万个连接。

来自主题: AI资讯

5551 点击 2024-08-12 17:35

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

跨GPU的注意力并行，最高提速8倍，支持512万序列长度推理。

来自主题: AI技术研报

9022 点击 2024-08-12 13:50

AI资讯新闻榜单内容搜索-GPU

GPU推理时代终结？世界最大芯片加持推理狂飙20倍，英伟达H100也被干趴！

百万卡AI集群，离不开英伟达网络

Beidi Chen陈贝迪 独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design

“印度马斯克”要发印度第一款 AI 芯片，号称超越英伟达，CEO 要“狼性”，但把数十亿美元打水漂

强攻GPU，TPU芯片一夜蹿红

买不起英伟达“特供”，中国创业者偏爱4090

论文荣登计算机体系结构顶会ISCA，芯片架构成为边缘AI最佳并行计算选择

喧嚣背后，国产GPU距离“平替”英伟达还有多远?

把两块芯片压成一块：EUV以来半导体制造的最大创新

30行代码，500万长文本推理提速8倍！「树注意力」让GPU越多省的越多

Beidi Chen陈贝迪独家 | 高效长序列生成之路：CPU & GPU —— 算法、系统与硬件的 co-design