NVIDIA 在 GTC 上宣布推出搭載地表最大規模 GPU 的 DGX 2 超級電腦,嚴格來說所謂的地表最大規模 GPU 並非全新的 GPU 架構,而是藉由全新的 NVSwitch 技術,透過 12 個 NVSwitch 晶片一口氣將 16 張 Tesla V100 GPU 串接,使得 16 張 Tesla V100 能夠共享運算資源、記憶體並且相互溝通,構成一個超大型 GPU 。 DGX 2 預計在第三季推出,售價為 39.9 萬美金。
同時黃仁宣也宣布 Tesla V100 也進行小幅度升級,將 HBM 記憶體一口氣翻倍達到單張 32GB ,故這個超大型 GPU 擁有高達 512GB 的 HBM 記憶體。
NVSwitch 由台積電代工,基本通道仍是基於原本最多可串接 8 組 Tesla V100 GPU 的 NVLink 2 ,故 DGX 2 實際上是將 2 組 NVLink2 通道利用 12 個 NVSwitch 相互串接,打通 16 個 Tesla V100 的溝通通道 ,單一 NVSwitch 供高達 2.4TB 的頻寬,讓 GPU 彼此之間無論是溝通、記憶體共享以及偕同運算等都宛若一顆巨型 GPU ,這個怪物級的 GPU 共有 81,900 個 CUDA Core ,單一工作站就可提供高達 2 Petaflops 的運算性能,而當前全球最快的超級電腦的運算力為 125 Petaflops 。
而 DGX 2 搭載兩顆 Xeon CPU ,搭配 1.5TB 的 RAM ,並具備 30TB 的 PCIe SSD ,內部結構可分為三層,將各別 8 個 Tesla V100 構成一層,兩層 GPU 群之間透過 NVLink Plane Card 連接在一起,最下層為 CPU 與 RAM 等,藉由分層方式使風道最佳化,而功耗為 10kW ,以超級電腦的功耗性能比可說是相當驚人的 。
延伸閱讀:
2 則回應