AI资讯新闻榜单内容搜索-GPU

兄弟俩用开源对抗AI训练垄断，还顺手帮模型们修了一堆Bug

2023 年的秋天，当全世界都在为 ChatGPT 和大语言模型疯狂的时候，远在澳大利亚悉尼的一对兄弟却在为一个看似简单的问题发愁：为什么微调一个开源模型要花这么长时间，还要用那么昂贵的 GPU？

来自主题: AI资讯

8942 点击 2025-10-28 10:40

DeepSeek新模型被硅谷夸疯了！用二维视觉压缩一维文字，单GPU能跑，“谷歌核心机密被开源”

DeepSeek最新开源的模型，已经被硅谷夸疯了！

来自主题: AI技术研报

7130 点击 2025-10-22 11:57

甲骨文推出全球最大AI超算，作为OpenAI「星际之门」算力核心

甲骨文于上周发布全球最大云端AI超级计算机「OCI Zettascale10」，由80万块NVIDIA GPU组成，峰值算力高达16 ZettaFLOPS，成为OpenAI「星际之门」集群的算力核心。其独创Acceleron RoCE网络实现GPU间高效互联，显著提升性能与能效。该系统象征甲骨文在AI基础设施竞争中的强势布局。

来自主题: AI资讯

8662 点击 2025-10-21 12:07

Meta用40万个GPU小时做了一个实验，只为弄清强化学习Scaling Law

在 LLM 领域，扩大强化学习算力规模正在成为一个关键的研究范式。但要想弄清楚 RL 的 Scaling Law 具体是什么样子，还有几个关键问题悬而未决：如何 scale？scale 什么是有价值的？RL 真的能如预期般 scale 吗？

来自主题: AI技术研报

8564 点击 2025-10-19 17:54

苏姿丰出手！Oracle下单5万颗AMD芯片，英伟达王座撼动

AMD再下一城！Oracle宣布自2026年第三季度起，将在其云基础设施（OCI）部署5万颗AMD Instinct™ MI450系列GPU，构建全新AI超级集群，并计划持续扩容。此举标志着AMD与Oracle的合作迈入新阶段，也被视为AMD在打破英伟达长期主导的AI算力生态中的又一关键突破。

来自主题: AI资讯

5811 点击 2025-10-17 16:21

李飞飞全新「世界模型」问世！单张H100实时生成3D永恒世界

一张图，一个3D世界！今天，李飞飞团队重磅放出实时生成世界模型「RTFM」，通过端到端学习大规模视频数据，直接从输入2D图像生成同一场景下新视角的图像。值得一提的是，它仅需单块H100 GPU便能实时渲染出持久且3D一致的世界。

来自主题: AI资讯

8504 点击 2025-10-17 11:55

李飞飞发布全新世界模型，单GPU就能跑！

李飞飞的世界模型创业，最新成果来了！刚刚，教母亲自宣布对外推出全新模型RTFM（A Real-Time Frame Model），不仅具备实时运行、持久性和3D一致性，更关键的是——单张H100 GPU就能跑。

来自主题: AI资讯

9998 点击 2025-10-17 09:08

英伟达AI超算3999开售，「掌心之中」可部署所有大参数开源模型！

英伟达面向个人的AI超算DGX Spark已上市！128GB统一内存（常规系统内存+GPU显存），加上允许将两台DGX Spark连起来，直接可以跑起来405B的大模型（FP4精度），而这已经逼近目前开源的最大模型！如此恐怖的实力却格外安静优雅，大小与Mac mini相仿，3999美元带回家！

来自主题: AI资讯

8969 点击 2025-10-14 22:34

Karpathy「疯狂之作」：100美元、4小时，就能训练你自己的「小型GPT」

AI传奇人物、前特斯拉AI总监Karpathy重磅推出全新开源项目「nanochat」，以不到8000行代码复现ChatGPT全流程，只需一台GPU、约4小时、成本仅百美元。该项目在GitHub上线不到12小时即获4.2k星标！

来自主题: AI资讯

10772 点击 2025-10-14 13:42

刚刚，全球首个GB300巨兽救场！一年烧光70亿，OpenAI内斗GPU惨烈

为了争夺有限的GPU，OpenAI内部一度打得不可开交。2024年总算力投入70亿美元，但算力需求依旧是无底洞。恰恰，微软发布了全球首台GB300超算，专供OpenAI让万亿LLM数天训完。

来自主题: AI资讯

8384 点击 2025-10-11 10:42