AI资讯新闻榜单内容搜索-GPU

马斯克“巨硬计划”新动作曝光！从0建起算力集群，6个月完成OpenAI&甲骨文15个月的工作

马斯克“巨硬计划”（MACROHARD）新动作曝光： 6个月从0建起算力集群，已完成200MW供电规模，足以支持11万台英伟达GB200 GPU NVL72。仅用6个时间，完成了OpenAI和甲骨文等合作花费15个月完成的工作，再次创造纪录。

来自主题: AI资讯

8519 点击 2025-09-19 09:21

谷歌TPU团队原班人马组建，英伟达挑战者、AI芯片初创企业Groq又获融资。超出此前的6亿预期，此次融资高达7.5亿美元（约53亿人民币），Groq现估值69亿美元（约490亿人民币）。

来自主题: AI资讯

10406 点击 2025-09-18 14:30

总部位于首尔的芯片初创公司FuriosaAI 正筹备进行一轮可能超过 3 亿美元的 IPO 前融资，该公司致力于挑战英伟达的市场地位。

来自主题: AI资讯

9633 点击 2025-09-16 15:57

芯片再快，也快不过光！微软研究院在剑桥拼出了一台模拟光学计算机：用手机摄像头、Micro LED和透镜拼成，却在实验里跑出了速度快100倍、能效高100倍的潜力。这一成果如今登上Nature，或许，算力格局将被改写。

来自主题: AI资讯

9689 点击 2025-09-15 08:32

超长序列推理时的巨大开销如何降低？

来自主题: AI技术研报

10267 点击 2025-09-12 11:31

昨天，英伟达重磅发布了专为海量上下文AI打造的CUDA GPU——Rubin CPX，将大模型一次性推理带入「百万Token时代」。NVIDIA创始人兼CEO黄仁勋表示，Vera Rubin平台将再次推动AI计算的前沿，不仅带来下一代Rubin GPU，也将开创一个CPX的全新处理器类别。

来自主题: AI资讯

8507 点击 2025-09-11 12:31

全球最快的开源大模型来了——速度达到了每秒2000个tokens！虽然只有320亿参数（32B），吞吐量却是超过典型GPU部署的10倍以上的那种。它就是由阿联酋的穆罕默德·本·扎耶德人工智能大学（MBZUAI）和初创公司G42 AI合作推出的K2 Think。

来自主题: AI资讯

10222 点击 2025-09-10 23:15

老黄对token密集型任务下手了。

来自主题: AI资讯

10148 点击 2025-09-10 12:19

SpikingBrain借鉴大脑信息处理机制，具有线性/近线性复杂度，在超长序列上具有显著速度优势，在GPU上1M长度下TTFT 速度相比主流大模型提升26.5x， 4M长度下保守估计速度提升超过100x；

来自主题: AI技术研报

7141 点击 2025-09-09 10:25

Lambda 收入可观，英伟达主导地位稳固，大家都有美好未来据 The Information 最新消息称，英伟达已经与小型云服务提供商 Lambda 达成一笔总额高达 15 亿美元的合作协议，内容是前者将租赁后者搭载英伟达自研 AI 芯片的 GPU 服务器。

来自主题: AI资讯

8044 点击 2025-09-07 12:06