美國國家大氣研究中心新超級電腦將採 AMD 搭配 NVIDIA 異構,較現行純 CPU 系統效能高出三倍

2021.02.03 01:45PM

雖然異構運算當前是許多物理模擬的主流架構,然而受到慣用軟體影響,仍有不少氣象預測單位使用純 CPU 系統,不過美國國家大氣研究中心宣布將在 2022 年的下一代超級電腦系統自當前純 Intel CPU 的 Cheyenne 轉移到由 HPE 負責建置、採用 AMD Epyc 與 NVIDIA A100 的異構平台上,預計效能將比目前的系統高出三倍,有望成為屆時全球 Top500 前 25 強的系統。

由 HPE 取得標案的系統還未決定名稱,不過這項超過 3,500 美金的標案將以 HPE 的 Cray EX (原本的 Shasta )為基礎,預計具備 2,570 個節點,其中 2,488 個節點使用 AMd 預計在 3 月發表的第三代 Epyc 平台" Milan ",另外 82 個節點則由 Epyc Milan 搭配 NVIDIA 的 A100 組成,總 RAM 容量達 692TB ,透過 HPE 的 Slingshot 互連架構連接。

照片中提到了AMDA、EPYC、2ND GEN AMD EPYC

▲ 雖然 GPU 具有核心數量的優勢,但需要使用大量記憶體的運算則仍為 CPU 運算的優勢所在

美國國家大氣研究中心當前的 Cheyenne 具備 4,032 個節點,採用 Intel 的 Xeon Broadwell 純 CPU 架構,然而畢竟是 4 年前的純 CPU 系統, AMD Epyc 具備比起當前 Intel 系統更多核心優勢,同時結合 NVIDIA A100 的異構運算後更具運算與能源效率。不過美國國家大氣研究中心也指出為何系統並非全面採用異構節點的關鍵,主因還是出在 GPU 雖然比起 CPU 具更好的運算規模,但記憶體容量仍不及 CPU ,故最終系統節點仍多為 CPU 節點。

在新系統啟用後,除了傳統的氣象預測以外,美國國家大氣研究中心的研究員將應用機器學習演算法模擬異長天氣,例如颶風、冰雹、也火與太陽風暴,過往的歷史資料也將成為演算法良好的基礎。

不過從當前許多超級電腦標案的情況,可預見 Intel 以往在超級電腦 Top 500 的 CPU 近乎 100% 的佔有率將面臨挑戰,另外雖然 AMD 想推 CDNA 與 NVIDIA 抗衡,但由於 CUDA 加速運算的環境成熟度高, NVIDIA 仍在加速運算佔有優勢。

資料來源

22 則回應