FOREXBNB獲悉,據知情人士透露,英偉達(NVDA.US)新一代 Blackwell AI晶片在高容量伺服器機架中存在嚴重的過熱問題。這些問題導致設計調整與專案延期,使谷歌、 Meta 和微軟等主要客戶對能否依計畫部署 Blackwell 伺服器感到擔憂。
知情人士透露,Blackwell GPU 專為 AI 和高效能運算(HPC)設計,但在配置 72 個處理器的伺服器中出現過熱問題,此類伺服器每個機架功耗最高可達 120 千瓦。过热问题迫使英伟达多次修改机架設計,不僅限制了 GPU 效能,也可能損壞硬體。客戶因此擔心,這些技術問題會延遲資料中心的處理器部署進程。
為應對這一難題,英偉達要求供應商調整機架設計,並與合作夥伴一起優化散熱系統。儘管這種工程改進是大規模技術發布的常規步驟,但也進一步延後了產品交付時間。
英偉達發言人針對此事回應稱,公司正與雲端服務供應商密切合作,設計調整屬於正常研發流程的一部分。英偉達希望透過這種合作,確保最終產品在性能和可靠性方面達到預期,同時加緊解決技術瓶頸。
修訂後的 Blackwell GPU 於今年 10 月底才進入量產,預計最快明年 1 月底出貨。Google、Meta、微軟等科技巨頭依賴英偉達 GPU 訓練其最強的 AI 模型,其延期對這些客戶的研發計畫和產品發布造成的影響自然是不可避免。
今年 3 月,英偉達展示了 Blackwell 晶片,當時曾表示將在第二季出貨。