主要是一些成本測算。
Open AI Stargate 合資企業的公告讓許多人感到震驚,儘管我們幾個月前就指出了OpenAI近期計劃的資本需求。5000 億美元的截止日期是一個震撼人心的數字,這也引發了像埃隆·馬斯克這樣的人的合理懷疑,他表示軟銀的資金保障遠低於 100 億美元。山姆·阿爾特曼反擊稱項目已經在建設中,並邀請大家來參觀。
集群測量比賽
看到精英們在進行他們的測量比賽,雖然他們各有道理,但這很有趣。軟銀的資金遠遠不足以支持這個集群。同時,集群已經在德州開工建設。
現實是,只有第一階段是確定的,即承諾的 1000 億美元的一部分,但這個總數的計算方式至少可以說是有趣的。我們在四個月前的多數據中心培訓報告中已經公開討論了德克薩斯州阿比林這個數據中心地點的第一階段。我們在加速器產業模型和資料中心產業模型中也已經有了相當長一段時間。
下面我們將討論 Stargate 的實際情況,微軟的情況以及那裡的危機,結構和成本,以及這個集群的真實性。
星際之門背後的真實數字
我們相信這個項目是基於總擁有成本(TCO)進行評估的,而不是資本支出。也就是說1000 億美元和 5000 億美元是總擁有成本,其中包括數據中心、伺服器、網路成本、電力成本以及許多其他運營成本,包括債務/融資成本。此外,我們認為只有前 1000 億美元有資料中心地點和電力準備就緒。資金仍未完全到位。
另一個誤導性的細節是,這個大型專案的第一個集群是去年宣布的 Oracle OpenAI 交易。這完全由 Lancium、Crusoe 和 Oracle 建造。據我們所知,沒有其他公司如軟銀和 MGX參與。
項目概述
星際門戶合資企業是一家新公司,計劃在未來四年內投資 5000 億美元於人工智能基礎設施,其中 1000 億美元將立即投入。這是第二任川普政府宣布的第一個大型人工智慧倡議,预计由于监管的显著放松,還會有更多類似的舉措。
Stargate 的股權創始人是軟銀、甲骨文、MGX和 OpenAI,其中前三家公司最初貢獻了資本。軟銀和 OpenAI 是主要合作夥伴,軟銀負責財務,0penAI負責營運,包括幾乎所有的集群管理軟件。
該項目包括建設 20 個資料中心,其中 10 個已在德州阿比林開工,每個資料中心大约 500,000 平方英尺。我們在下面提供有關該園區的更多信息,來自我們的數據中心行業模型。
初始 1000 億美元投資的範圍和地點
初始的 Oracle/Crusoe 被納入作為將連接到其他 Gigacampus 的數據中心之一,以進行規模比任何其他訓練運行大幾個數量級的分佈式訓練。巧妙的是,他們通過這個獨立實體選擇了一種更具創意的融資結構,這將推遲籌款的需求。
薩姆·阿爾特曼提到的“已經在進行中的 Ghe Stargate 合資校園"是 Oracle/CrusoeAbilene 校園。该校園正在建设中,以容納 OAI 使用的 100k GB200 叢集。此項開發以及預計在第二季和第三季出貨的 GB200 服務器將被放入 Oracle/Crusoe 數據中心。
以下是 2024 年 12 月 29 日校園的高分辨率照片。大約 120,000 平方英尺的四個模組構成一個 480,000 平方英尺的建築,因此目前僅建造了兩棟建築,具備約 180MW 的關鍵 IT容量。為了讓人理解這項建設規模,20 座建築的校園將由 80 個這樣的模組組成!
根據我們為 OpenAI/Microsoft/Oracle 在加速器模型和數據中心模型中安排的建設OpenAI 不需要建立新的校園來支出全部 1000 億美元的總擁有成本。因此,我們相信Stargate 合資企業的初始 1000 億美元將全部用於這個校園。
這個模型中的校園被稱為 Lancium Crusoe Abilene 清潔校園,其網站上聲明的容量為 2025年啟用的 1GW。然而,我們透過多個行業來源和文件了解到,該校園已解鎖另一個 1GW。這總共提供了 2.2GW 的電力。因此,我們根據我們的數據中心模型估計該校園的關鍵 IT容量為 1.8GW。這是一個約為 1.25 的 PUE。他們可能能夠改善 PUE,以接近 2GW 的 IT容量,但考慮到 GB300 和特別是 VR200 的功率密度增加,這將是困難的。
電力、租金、資本支出和 GPU 支出細分
除了正在進行的 100k GB200 集群外,我們估計校園內還將部署另外 200k GB300 和約400k VR200。我們根據校園總計的 1000 億美元 TCO 投資和我們 AI TCO 模型中的每單位 TCO 計算了隱含的 Vera Rubin 單元數量。大約 70 萬 GPU 的總 IT 功率為 1.8GW,這與 Oracle/Crusoe Abilene 校園的 1800MW 容量相符。
簡而言之,我們估計 OpenAI 為第一個 GB200 集群支付的費用大約為每小時$2.8,這對於全規模集群的總擁有成本(TCO)為每小時$2.38。這些數字會隨著未來 Nvidia GPu 的部署而變化。0penAI的支出將超過$100B,但並不是前期資本。我們估計Nvidia 來自此項及 IT 設備資本支出的收入較為溫和,約為$37.5B 和$49B。這將佔用整個 1.8GW 的Crusoe Lancium 場地。
專案的財務支持
甲骨文和軟銀是知名的股權提供者。MGX 是阿布達比最近成立的技術投資工具,由穆巴達拉和 G42 共同創立。該基金由謝赫·塔赫努恩·本·扎耶德·阿爾·納哈揚擔任主席,他負責管理超過 1.5 萬億美元的投資基金。鑑於最近埃隆·馬斯克聲稱軟銀只能籌不到 100 億美元,值得注意的是,合資企業也將為專案融資籌集債務資本。目前尚不清楚股權和債務融資的組合將是什麼,甲骨文和 MGX 可以利用其龐大的資產負債表為項目提供大部分資金。
OpenAI和軟銀據稱在帳面上各損失了 190 億美元。軟銀今天沒有這樣的流動資金,但我們認為軟銀可能需要出售其部分 ARM 股份來籌集資金。OpenAI也沒有資本,但他們將能夠透過 o了的發布來籌集資金,他們不必完全直接進行,但可以通過向財團中的其他人發行某種混合工具來實現。
埃隆·馬斯克是對的,他們還沒有錢。
問題是項目融資風險是否會與母公司分開。分離這項風險很重要,因為 0penAI需要籌集資金來支付這筆費用。幸運的是,OpenAI目前並不急需這筆資金。OAI擁有足夠的現有資本來支付今年 100k GB200 集群的租金,但他們需要能夠在 2026 年及以後支付租金這筆費用將大幅增加。OpenAI 可能無法直接籌措這筆資金,但我們相信他們的技術和產品將能夠支持這一點。
星際之門合資企業的現實-勝者與敗者
許多知名公司與 Stargate 合資一同宣布,包括 Nvidia、Arm、Microsoft、Oracle 以及之前提到的融資方。這些名字都很大且令人印象深刻,但現實是有明顯的贏家和輸家。
微軟是最大的輸家
微軟在 OpenAI 利用另一家基礎設施合作夥伴時基本上被擱置。正如薩提亞·納德拉所說:“我所知道的就是,我為我的 800 億美元感到滿意。"微軟最近的博客文章陳述了合作關係的事實以及微軟擁有優先購買權,但現實是,這對微軟的長期發展是逐步負面的,因為他們害怕承擔這項投資的風險。另外,負責 OpenAI合作關係的克里斯·楊在公告後也突然離職。看漲者會說微軟正在將其人工智慧計畫的部分資本密集度轉移到甲骨文,但我們認為這種短期利益無法彌補失去 OpenAI的收入和控制權所帶來的長期潛在損害。
儘管埃隆·馬斯克和薩提亞·納德拉都在問同樣的問題:“實際的錢在哪裡?“埃隆·馬斯克有個計劃,旨在讓他們在田納西州孟菲斯的基地發展得和 OpenAI一樣快,甚至更快。薩提亞·納德拉沒有計劃在內部構建領先的人工智能模型。
Arm-技術夥伴還是假新聞
Arm 因被指定為技術合作夥伴而上漲了約 16%,但這僅僅是因為與 Nvidia 的 Blackwell和 Rubin GPU 配套的 Grace 和 Vera CPU。軟銀可能推動 Arm 參與公關,效果看起來不錯。Arm 並沒有太多作為。
對於 Arm 的股東來說,如上所述,軟銀可能需要出售其在公司的部分股份,以為 Stargate的股權支出提供資金。,我們認為投資者在很大程度上忽視了這一點,錯誤地將此公告視為實質性的增量好消息。
甲骨文面臨巨大的壓力,既要處理資料中心管理,又要管理供應鏈物流。管理一個1.8GW 的集群並在另一家公司指揮下採購所有必要設備是一項相當艱鉅的任務。英偉達顯然參與其中,因為這是他們的硬件。0penAI將繼續控制運營,並幾乎運行自己所有的集群管理軟件。
星際之門合資企業的未來
該項目的規模令人印象深刻,但確實感覺像是人工智慧週期中一個充滿活力的進展的下-步,正如我們最近在《虛構知識》中所寫的那樣。我們知道前1000 億美元將用於阿比林,剩餘的 4000 億美元將開發更多校園。更令人印象深刻的是,所有這些數據中心校園將繼續建設,旨在實現分散式訓練。
我們的數據中心模型訂閱者將是首批了解剩餘站點位置的人。請記住,僅將阿比林校園重複四次,就可以獲得 9GW 的關鍵 IT 容量,完全分配用於一次培訓。
我們認為 Marvell 和 Ciena 將是持續 DCI 建設中最大的贏家,而 Fabrinet 將獲得相當的好處,Coherent/Lumentum 的受益程度則較小。
本文轉載自“思變行研”微信公眾號;FOREXBNB編輯:黃曉冬。