Elon Musk宣布以10萬個液冷NVIDIA H100建構的超級叢集投入xAI的GROK 3模型訓練

by Chevelle.fu

2024.07.24 12:11PM

Tesla創辦人、同時也是社群服務X董事長Elon Musk宣布xAI建構的超大型GPU叢集已投入GROK 3的模型訓練，xAI的超大型叢集由高達10萬個使用液冷的NVIDIA H100 GPU構成，是目前全球最大規模的RDMA單一GPU叢集。在xAI的叢集投入服務後，xAI預計於2024年12月推出以該套系統建構的GROK 3模型，Elon Musk指稱屆時將會是全球最先進的AI模型。

Nice work by @xAI team, @X team, @Nvidia & supporting companies getting Memphis Supercluster training started at ~4:20am local time.

With 100k liquid-cooled H100s on a single RDMA fabric, it’s the most powerful AI training cluster in the world!
— Elon Musk (@elonmusk) July 22, 2024

▲可能由於xAI需要的GPU數量相當龐大、加上成本考量因素，故選擇H100而非記憶體增量的H200

原本xAI是向Oricle租賃雲服務進行GROK的模型訓練，不過xAI最後打算自行持有超級電腦；然而比較意外的是Elon Musk選擇的GPU以目前NVIDIA的產品藍圖有些尷尬，因為NVIDIA正陸續出貨具有更高容量且更高頻寬的NVIDIA H200，同時NVIDIA很快就會在2024年底至2025年初開始提供新一代Blackwell架構的B200 GPU，主要的原因恐怕與Elon Musk所需的GPU數量相當驚人，若要一次到位NVIDIA可能也難以在第一時間供應如此大量的新產品，同時Elon Musk對於價格也相當精打細算，故選擇已經問是一段時間的H100。

資料來源

Elon Musk(X)

Chevelle.fu

甚麼都懂一點、甚麼都不精

文章共19777篇

開箱評測

AGi EDM38磁吸式外接SSD固態硬碟！秒擴充iPhone儲存空間、向錄影容量焦慮說掰掰！

8 天前

AGi EDM38磁吸式外接SSD固態硬碟！秒擴充iPhone儲存空間、向錄影容量焦慮說掰掰！

遊戲天堂

多間寶可夢中心將針對黃牛展開新的一波反制手法

凱拉特

9 天前

多間寶可夢中心將針對黃牛展開新的一波反制手法

開箱評測

DJI Pocket 3原價全能套裝補貨免費加贈SanDisk Extreme記憶卡指定支付送5%P幣

Tandee

9 個小時前

DJI Pocket 3原價全能套裝補貨免費加贈SanDisk Extreme記憶卡指定支付送5%P幣

開箱評測

花1700元買支備用手機雙SIM卡還能裝記憶卡這規格跟價格沒什麼好嫌了

atticus

7 個小時前

花1700元買支備用手機雙SIM卡還能裝記憶卡這規格跟價格沒什麼好嫌了

開箱評測

影片隨錄隨存超方便，AGI EDM38 1TB 磁吸外接式固態硬碟開箱試用

10 天前

影片隨錄隨存超方便，AGI EDM38 1TB 磁吸外接式固態硬碟開箱試用

遊戲天堂

古早訪談揭露任天堂曾為超級瑪利歐64計劃過「正宗續作」

凱拉特

9 天前

古早訪談揭露任天堂曾為超級瑪利歐64計劃過「正宗續作」

遊戲天堂

日本au將在2025年10月終止GeForce NOW服務，主要受到用戶減少與NVIDIA也在日本投入營運影響

Chevelle.fu

11 個小時前

日本au將在2025年10月終止GeForce NOW服務，主要受到用戶減少與NVIDIA也在日本投入營運影響

產業消息

陳立武公開信表示Intel將透過組織扁平化、精簡化改革，裁員、混合辦公型態進辦公室多一天皆是手段

Chevelle.fu

11 個小時前

陳立武公開信表示Intel將透過組織扁平化、精簡化改革，裁員、混合辦公型態進辦公室多一天皆是手段

開箱評測

3C 開箱 | AGi EDM38 | 磁吸式 Type-C 外接式 SSD，iPhone 15 Pro 高畫質錄影沒煩惱！

7 天前

3C 開箱 | AGi EDM38 | 磁吸式 Type-C 外接式 SSD，iPhone 15 Pro 高畫質錄影沒煩惱！