主要是一些成本测算。

SemiAnalysis:星际之门和成本测算 - 图片1

Open AI Stargate 合资企业的公告让许多人感到震惊,尽管我们几个月前就指出了OpenAI近期计划的资本需求。5000 亿美元的截止日期是一个震撼人心的数字,这也引发了像埃隆·马斯克这样的人的合理怀疑,他表示软银的资金保障远低于 100 亿美元。山姆·阿尔特曼反击称项目已经在建设中,并邀请大家来参观。

集群测量比赛

看到精英们在进行他们的测量比赛,虽然他们各有道理,但这很有趣。软银的资金远远不足以支持这个集群。同时,集群已经在德克萨斯州开工建设。

现实是,只有第一阶段是确定的,即承诺的 1000 亿美元的一部分,但这个总数的计算方式至少可以说是有趣的。我们在四个月前的多数据中心培训报告中已经公开讨论了德克萨斯州阿比林这个数据中心地点的第一阶段。我们在加速器行业模型和数据中心行业模型中也已经有了相当长一段时间。

下面我们将讨论 Stargate 的实际情况,微软的情况以及那里的危机,结构和成本,以及这个集群的真实性。

星际之门背后的真实数字

我们相信这个项目是基于总拥有成本(TCO)进行评估的,而不是资本支出。也就是说1000 亿美元和 5000 亿美元是总拥有成本,其中包括数据中心、服务器、网络成本、电力成本以及许多其他运营成本,包括债务/融资成本。此外,我们认为只有前 1000 亿美元有数据中心地点和电力准备就绪。资金仍未完全到位。

另一个误导性的细节是,这个大型项目的第一个集群是去年宣布的 Oracle OpenAI 交易。这完全由 Lancium、Crusoe 和 Oracle 建造。据我们所知,没有其他公司如软银和 MGX参与。

项目概述

星际门户合资企业是一家新公司,计划在未来四年内投资 5000 亿美元于人工智能基础设施,其中 1000 亿美元将立即投入。这是第二任特朗普政府宣布的第一个大型人工智能倡议,预计由于监管的显著放松,还会有更多类似的举措。

Stargate 的股权创始人是软银、甲骨文、MGX和 OpenAI,其中前三家公司最初贡献了资本。软银和 OpenAI 是主要合作伙伴,软银负责财务,0penAI负责运营,包括几乎所有的集群管理软件。

该项目包括建设 20 个数据中心,其中 10 个已在德克萨斯州阿比林开工,每个数据中心大约 500,000 平方英尺。我们在下面提供有关该园区的更多信息,来自我们的数据中心行业模型。

初始 1000 亿美元投资的范围和地点

初始的 Oracle/Crusoe 被纳入作为将连接到其他 Gigacampus 的数据中心之一,以进行规模比任何其他训练运行大几个数量级的分布式训练。巧妙的是,他们通过这个独立实体选择了一种更具创意的融资结构,这将推迟筹款的需求。

SemiAnalysis:星际之门和成本测算 - 图片2

萨姆·阿尔特曼提到的“已经在进行中的 Ghe Stargate 合资企业校园"是 Oracle/CrusoeAbilene 校园。该校园正在建设中,以容纳 OAI 使用的 100k GB200 集群。此项开发以及预计在第二季度和第三季度发货的 GB200 服务器将被放入 Oracle/Crusoe 数据中心。

以下是 2024 年 12 月 29 日校园的高分辨率照片。大约 120,000 平方英尺的四个模块构成一个 480,000 平方英尺的建筑,因此目前仅建造了两座建筑,具备约 180MW 的关键 IT容量。为了让人理解这一建设规模,20 座建筑的校园将由 80 个这样的模块组成!

SemiAnalysis:星际之门和成本测算 - 图片3

根据我们为 OpenAI/Microsoft/Oracle 在加速器模型和数据中心模型中安排的建设OpenAI 不需要建立新的校园来支出全部 1000 亿美元的总拥有成本。因此,我们相信Stargate 合资企业的初始 1000 亿美元将全部用于这个校园。

SemiAnalysis:星际之门和成本测算 - 图片4

该模型中的校园被称为 Lancium Crusoe Abilene 清洁校园,其网站上声明的容量为 2025年启用的 1GW。然而,我们通过多个行业来源和文件了解到,该校园已解锁另一个 1GW。这总共提供了 2.2GW 的电力。因此,我们根据我们的数据中心模型估计该校园的关键 IT容量为 1.8GW。这是一个约为 1.25 的 PUE。他们可能能够改善 PUE,以接近 2GW 的 IT容量,但考虑到 GB300 和特别是 VR200 的功率密度增加,这将是困难的。

电力、租金、资本支出和 GPU 支出细分

除了正在进行的 100k GB200 集群外,我们估计校园内还将部署另外 200k GB300 和约400k VR200。我们根据校园总计的 1000 亿美元 TCO 投资和我们 AI TCO 模型中的每单位 TCO 计算了隐含的 Vera Rubin 单元数量。大约 70 万 GPU 的总 IT 功率为 1.8GW,这与 Oracle/Crusoe Abilene 校园的 1800MW 容量相符。

简而言之,我们估计 OpenAI 为第一个 GB200 集群支付的费用大约为每小时$2.8,这对于全规模集群的总拥有成本(TCO)为每小时$2.38。这些数字会随着未来 Nvidia GPu 的部署而变化。0penAI的支出将超过$100B,但并不是前期资本。我们估计Nvidia 来自此项及 IT 设备资本支出的收入较为温和,约为$37.5B 和$49B。这将占用整个 1.8GW 的Crusoe Lancium 场地。

SemiAnalysis:星际之门和成本测算 - 图片5

项目的财务支持

甲骨文和软银是知名的股权提供者。MGX 是阿布扎比最近成立的技术投资工具,由穆巴达拉和 G42 共同创立。该基金由谢赫·塔赫努恩·本·扎耶德·阿尔·纳哈扬担任主席,他负责管理超过 1.5 万亿美元的投资基金。鉴于最近埃隆·马斯克声称软银只能筹集不到 100 亿美元,值得注意的是,合资企业还将为项目融资筹集债务资本。目前尚不清楚股权和债务融资的组合将是什么,甲骨文和 MGX 可以利用其庞大的资产负债表为项目提供大部分资金。

OpenAI和软银据称在账面上各损失了 190 亿美元。软银今天没有这样的流动资金,但我们认为软银可能需要出售其部分 ARM 股份来筹集资金。OpenAI也没有资本,但他们将能够通过 o了的发布来筹集资金,他们不必完全直接进行,但可以通过向财团中的其他人发行某种混合工具来实现。

埃隆·马斯克是对的,他们还没有钱。

问题是项目融资风险是否会与母公司分开。分离这一风险很重要,因为 0penAI需要筹集资金来支付这笔费用。幸运的是,OpenAI目前并不急需这笔资金。OAI拥有足够的现有资本来支付今年 100k GB200 集群的租金,但他们需要能够在 2026 年及以后支付租金这笔费用将大幅增加。OpenAI 可能无法直接筹集到这笔资金,但我们相信他们的技术和产品将能够支持这一点。

星际之门合资企业的现实-胜者与败者

许多知名公司与 Stargate 合资企业一同宣布,包括 Nvidia、Arm、Microsoft、Oracle 以及之前提到的融资方。这些名字都很大且令人印象深刻,但现实是有明显的赢家和输家。

SemiAnalysis:星际之门和成本测算 - 图片6

微软是最大的输家

微软在 OpenAI 利用另一家基础设施合作伙伴时基本上被搁置。正如萨提亚·纳德拉所说:“我所知道的就是,我为我的 800 亿美元感到满意。"微软最近的博客文章陈述了合作关系的事实以及微软拥有优先购买权,但现实是,这对微软的长期发展是逐步负面的,因为他们害怕承担这项投资的风险。此外,负责 OpenAI合作关系的克里斯·杨在公告后也突然离职。看涨者会说微软正在将其人工智能计划的一部分资本密集度转移到甲骨文,但我们认为这种短期利益无法弥补失去 OpenAI的收入和控制权所带来的长期潜在损害。

尽管埃隆·马斯克和萨提亚·纳德拉都在问同样的问题:“实际的钱在哪里?“埃隆·马斯克有个计划,旨在让他们在田纳西州孟菲斯的基地发展得和 OpenAI一样快,甚至更快。萨提亚·纳德拉没有计划在内部构建领先的人工智能模型。

Arm-技术合作伙伴还是假新闻

Arm 因被指定为技术合作伙伴而上涨了约 16%,但这仅仅是因为与 Nvidia 的 Blackwell和 Rubin GPU 配套的 Grace 和 Vera CPU。软银可能推动 Arm 参与公关,效果看起来不错。Arm 并没有太多作为。

对于 Arm 的股东来说,如上所述,软银可能需要出售其在公司的部分股份,以为 Stargate的股权支出提供资金。,我们认为投资者在很大程度上忽视了这一点,错误地将此公告视为实质性的增量好消息。

甲骨文面临着巨大的压力,既要处理数据中心管理,又要管理供应链物流。管理一个1.8GW 的集群并在另一家公司指挥下采购所有必要设备是一项相当艰巨的任务。英伟达显然参与其中,因为这是他们的硬件。0penAI将继续控制运营,并几乎运行自己所有的集群管理软件。

星际之门合资企业的未来

该项目的规模令人印象深刻,但确实感觉像是人工智能周期中一个充满活力的进展的下-步,正如我们最近在《虚构知识》中所写的那样。我们知道前1000 亿美元将用于阿比林,剩余的 4000 亿美元将开发更多校园。更令人印象深刻的是,所有这些数据中心校园将继续建设,旨在实现分布式训练。

我们的数据中心模型订阅者将是首批了解剩余站点位置的人。请记住,仅仅将阿比林校园重复四次,就可以获得 9GW 的关键 IT 容量,完全分配用于一次培训。

我们认为 Marvell 和 Ciena 将是持续 DCI 建设中最大的赢家,而 Fabrinet 将获得相当的好处,Coherent/Lumentum 的受益程度则较小。

本文转载自“思变行研”微信公众号;FOREXBNB编辑:黄晓冬。