NVIDIA 與 HPE 協助阿貢國家實驗室設置 1.4 PETAFLOPS AI 算力的 Polaris 超級電腦,填補採全 Intel 技術 Aurora 系統延後上線的空窗

2021.08.26 01:16AM

根據原本 Intel 與隸屬美國能源局的阿貢國家實驗室簽署的合約, 2021 年將啟用結合 Intel Xeon CPU 、 Xe GPU 與 Optane DC 儲存的 Exaflops 等級超級電腦 Aurora ,不過隨著 Ponte Vecchio 的正式推出時間延至 2022 年, Aurora 的上線時間也被迫順延;不過阿貢國家實驗室為了填補 Aurora 上線的空窗期,先導入基於 NVIDIA A100 Tensor GPU 的超算系統 Polaris ,以 AMD EPYC CPU 結合 NVIDIA A100 GPU 提供與 44 PetaFLOPS 的峰值雙精度算力,作為屆時 Aurora 上線前的先導;雖然雙精度算力不及 Aurora ,但卻提供高達 1.4 ExaFLOPS 的 AI 算力。

Polaris 定位在以 AI 結合加速技術提供研究癌症治療、探索再生能源、推動粒子碰撞研究與發掘新的物理研究方式等目的,同時也將成為屆時 Aurora 上線之後,透過 AI 協助 Aurora 以更有效率的方式執行科學運算作業負載。

照片中提到了Argonne A、OENERGY、(intel,跟英特爾、英特爾有關,包含了獎、超級電腦、萬億級計算、顯示卡

▲原定 2021 年上線的 Aurora 因包括 Ponte Vecchio 進度比預期晚而延後上線,阿貢實驗室選擇建構規模僅 1/15 的 Polaris 做為過渡

Polaris 由 HPE 慧與科技協助架設,主要針對處理資料密集型與 AI 高效能運算作業負載,並結合模擬與機器學習技術,整套系統有 560 個節點、每個節點包括 4 張 NVIDIA A100 GPU 、構成達 2,240 個 GPU 的加速型超算系統。不過 Polaris 畢竟是阿貢實驗室應急用的系統, Aurora 原定將具備高達 9,000 個節點、並消耗高達 60MW 的功率,然而 Polaris 僅消耗 2MW 功率。

此外 Polaris 雖是阿貢實驗室作為 Aurora 上線前的過渡系統,但即便只有 44 PetaFLOPS ,仍能在當前的 TOP500 榜單跨入前 10 名,除此之外根據國外報導, Polaris 也計畫透過架構升級方式,使其能夠與屆時上線後的 Aurora 能夠連接。

資料來源