AI资讯新闻榜单内容搜索-GPU

GPU 维修那些事： H100 哪里容易坏？以 Llama3 训练大模型为例

根据去年2024年7月28日Meta公司在训练大模型（Llama 3）时使用“16384 个英伟达H100 GPU 集群”的经验，该显卡在高负载、大规模集群运行环境下容易出现以下故障点：

来自主题: AI技术研报

11111 点击 2025-04-07 09:17

谷歌暗讽OpenAI：GPU在熔化，TPU火上浇油！Canvas免费开放，实测惊人

谷歌Canvas免费上线了！现在，所有用户都可以使用Gemini 2.5 Pro的Canvas了，谷歌激情放言：我们的TPU炙手可热，正在火上浇油。

来自主题: AI资讯

7837 点击 2025-04-06 17:55

英伟达GPU命名背后：是情怀，也是致敬伟人的智慧！

在刚刚结束的GTC大会上，黄仁勋公布了英伟达面向未来AI工厂的GPU路线图，从Ampere、Hopper，到Blackwell、Rubin和Feynman，每一代GPU架构都以历史上杰出的科学家命名。这些名字背后，不仅凝聚了人类科学智慧的巅峰成就，也寄托着Nvidia对科技创新的致敬与传承。

来自主题: AI资讯

8089 点击 2025-04-06 15:38

刚刚，特朗普扼杀全美GPU供应链？科技大厂核心AI算力告急，硅谷陷巨大恐慌

全美AI行业的GPU供应链，都要被特朗普扼杀了？目前，GPU是否能被全面关税豁免，还是一个谜，整个硅谷都陷入了恐慌！大科技公司CEO们的身家，更是一夜缩水上百亿。

来自主题: AI资讯

8454 点击 2025-04-06 15:18

GPU租赁市场调研

前几天有朋友还在问我GPU租赁市场的情况，正好SemiAnalysis出了这篇文章：GPU云ClusterMA评级系统 | GPU租用指南。

来自主题: AI技术研报

7176 点击 2025-04-04 16:23

AMD GPU性能暴涨7倍，优化算法首次开源！高效MoE支持任意专家数量

通过完全启用并发多块执行，支持任意专家数量（MAX_EXPERT_NUMBER==256），并积极利用共享内存（5kB LDS）和寄存器（52 VGPRs，48 SGPRs），MoE Align & Sort逻辑被精心设计，实现了显著的性能提升：A100提升3倍，H200提升3倍，MI100提升10倍，MI300X/MI300A提升7倍...

来自主题: AI技术研报

4209 点击 2025-04-03 16:14