马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作

AITNT-国内领先的一站式人工智能新闻资讯网站
# 热门搜索 #
马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作
5776点击    2025-09-19 09:21

马斯克“巨硬计划”(MACROHARD)新动作曝光:


6个月从0建起算力集群,已完成200MW供电规模,足以支持11万台英伟达GB200 GPU NVL72。


仅用6个时间,完成了OpenAI和甲骨文等合作花费15个月完成的工作,再次创造纪录。


在回答网友提问时,马斯克透露Colossus II算力集群正是与巨硬计划有关。


马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作


虽然尽管名字带有对微软的戏谑意味,但马斯克对这件事是认真的,而且最早从2021年就有这个想法了。


马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作


其核心逻辑为:既然软件公司不生产实体硬件,那么从编码、设计、测试到管理的全部流程,理论上都可以被AI复制。


“巨硬”将基于xAI的大型语言模型Grok构建多智能体系统。马斯克透露,项目将部署数百个专门的智能体,有的专精于编码,有的负责图像视频生成,有的专注软件测试。它们将协同工作,模拟一个完整的软件开发团队。


系统还会模拟人类用户在虚拟机中与正在开发的软件进行交互,通过不断的迭代和反馈来打磨产品。整个软件开发生命周期,从最初的需求分析、产品设计、编码实现,到质量保证和用户测试,都将由AI智能体自动化完成。


那么要让数百个复杂的AI代理同时工作并进行大规模软件模拟,没有超强算力是不可能实现的。


Colossus II正是为此存在。


史无前例的算力巨兽


关于xAI的Colossus I大家已经很熟悉,仅用122天建成约20万台H200 GPU的算力集群,随后的92天内将规模翻倍至20 万台GPU。


Colossus I至今仍是规模最大的AI训练算力集群。


马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作


现在马斯克正按“第一性原理”把成功经验迁移到到Colossus II,规模扩大几十倍,这次是为了AI推理。


Colossus II项目于2025年3月7日启动,当时xAI在孟菲斯收购了一座100万平方英尺的仓库和两块相邻地块,总面积达100英亩。


马斯克在7月份表示,部分机架已经开始安装。


到8月22日,现场已经安装了119台风冷式冷水机组,提供约200MW的冷却能力,足以支持约11万个GB200 NVL72 GPU。


按照规划,Colossus II第一阶段将部署11万个英伟达GB200 GPU,最终目标是超过55万个GPU,峰值功率需求预计超过1.1吉瓦。


更长远的路线图甚至计划将GPU总量扩展至100万个。


为解决巨大的电力需求,xAI采用了跨区域能源策略。


由于在孟菲斯当地获取吉瓦级电力面临阻力,xAI索性在州界对面的密西西比州收购了一座前杜克能源的发电厂。密西西比州监管机构已临时批准xAI在该地块运行燃气轮机长达12个月,无需正式许可。目前该发电厂已有7台35MW的涡轮机在运行。


为了在部署速度上超过竞争对手,xAI依赖租赁的燃气涡轮机。供应商Solaris Energy Infrastructure(SEI)拥有600MW的燃气涡轮机,其中约400MW目前服务于xAI,占67%。双方新成立的合资公司(Solaris持股50.1%,xAI持股49.9%)已在2025年第二季度投入1.12亿美元的资本支出。


另外,为避免对当地电网造成冲击,xAI还在Colossus II场址部署了168个特斯拉Megapack电池储能系统,在用电高峰期提供电力支持,确保当地居民不会遭遇停电。


马斯克亲自督战,项目进入冲刺阶段


就在昨天,马斯克晒出一份疯狂的工作日程表:


  • 周五晚上和Optimus工程团队熬夜工作,乘红眼航班飞往奥斯汀,凌晨5点到达,醒来后和孩子们共进午餐
  • 整个周六下午都在进行特斯拉AI5芯片设计的深度技术评审。
  • 周一飞往Colossus II,走遍整个数据中心楼层,审查变压器和电力生产(进展出色),午夜离开。”
  • 接着是长达12小时与特斯拉各个部门的会议,重点在AI/自动驾驶,机器人生产和汽车生产/交付。


马斯克“巨硬计划”新动作曝光!从0建起算力集群,6个月完成OpenAI&甲骨文15个月的工作


可以看出,巨硬已经成为马斯克商业版图中的关键一环。


特斯拉已将自身定位为“AI机器人公司”,未来80%的价值在机器人,巨硬开发的AI软件可用于优化特斯拉的自动驾驶算法、工厂自动化和人形机器人Optimus的功能。反过来,特斯拉海量的真实世界数据将为巨硬提供宝贵的训练数据。


参考链接:

[1]https://x.com/elonmusk/status/1967800687431127265

[2]https://semianalysis.com/2025/09/16/xais-colossus-2-first-gigawatt-datacenter/



文章来自于微信公众号 “量子位”,作者 “量子位”

AITNT-国内领先的一站式人工智能新闻资讯网站
AITNT资源拓展
根据文章内容,系统为您匹配了更有价值的资源信息。内容由AI生成,仅供参考
1
OWL

【开源免费】OWL是一个完全开源免费的通用智能体项目。它可以远程开Ubuntu容器、自动挂载数据、做规划、执行任务,堪称「云端超级打工人」而且做到了开源界GAIA性能天花板,达到了57.7%,超越Huggingface 提出的Open Deep Research 55.15%的表现。

项目地址:GitHub:https://github.com/camel-ai/owl

2
AI代理

【开源免费】Browser-use 是一个用户AI代理直接可以控制浏览器的工具。它能够让AI 自动执行浏览器中的各种任务,如比较价格、添加购物车、回复各种社交媒体等。

项目地址:https://github.com/browser-use/browser-use


3
智能体

【开源免费】AutoGPT是一个允许用户创建和运行智能体的(AI Agents)项目。用户创建的智能体能够自动执行各种任务,从而让AI有步骤的去解决实际问题。

项目地址:https://github.com/Significant-Gravitas/AutoGPT


【开源免费】MetaGPT是一个“软件开发公司”的智能体项目,只需要输入一句话的老板需求,MetaGPT即可输出用户故事 / 竞品分析 / 需求 / 数据结构 / APIs / 文件等软件开发的相关内容。MetaGPT内置了各种AI角色,包括产品经理 / 架构师 / 项目经理 / 工程师,MetaGPT提供了一个精心调配的软件公司研发全过程的SOP。

项目地址:https://github.com/geekan/MetaGPT/blob/main/docs/README_CN.md