近年游於異構運算在 HPC 領域奏效,加上美中關係緊張,美國皆連更新多套超算系統,也以 IBM 搭配 NVIDIA 構成的新一代超算平台 Summit 、 Sierra 再度從中國天河系列手上奪回 TOP500 超算排行榜單榜首,不過美國陸續還與 Intel 、 AMD 簽署超算平台協議,其中 AMD 與 Cray 將為 Lawrence Livermore National Laboratory 建構的 El Capitan 號稱將達到 2 exflops 的性能,強調較現行 TOP500 兩百強算力綜合還高,而 AMD 與 Cray 也在近日公布更多關於 El Capitan 的資訊。 El Capitan 預計在 2023 年初正式營運,將作為高效能模擬、建模,並應用在美國核能儲存的安全與可靠模擬,癌症藥物開發與癌症分析等。
El Capitan 將採用基於 AMD Zen4 的新一代 AMD EPYC 處理器,代號 Genoa ,而目前第二代的 EPYC 採用 Zen2 架構 ,故按照 AMD 每年升級一次架構的產品規劃,這款全新的 EPYC 將會在 2022 發表與開始供貨;搭配的 GPU 則是代號與架構都未公布的 AMD 次代 Radeon Instinct ,雖然 AMD 目前 GPU 已經邁向全新的 RDNA 架構,但先前傳出 AMD 在超算領域仍偏好使用 NGC 架構,很可能會在全新的高性能 Radeon Instinct ;維持 NGC 而非 RDNA ;而 AMD 也如同 NVIDIA 提供 NVLink 為 CPU 與 GPU 之間互連提供高速通道一樣,這套平台將採第三代 AMD Infinity 架構,提供高頻寬、低延遲的相互連接。
▲ El Captian 將採基於 Zen4 架構的下一代 EPYC 與全新 Radeon Instinct
El Capitan 的基礎系統原本標案由 CRAY 取得,不過隨著 CRAY 被 HPE 收購,現在則是在意義上轉為由 HPE 旗下的 CRAY 提供基礎系統, El Capitan 的系統建構在 Cray Shasta ,並以 Slingshot 技術提供高度的擴充性與跨主機的高速相互連接;另一個突破點是採用 HPE 新開發的光傳輸技術,能夠以更具效率且兼顧成本的方式提供高效能的傳輸。在目前的架構上, El Capitan 的刀鋒伺服器架構將以加速器為核心,每組刀鋒平台將以 GPU 與 CPU 為 4:1 的方式構成,能夠以 GPU 加速的方式提供高密度的 AI 運算、機器學習與分析使用。
根據現階段的預估, El Captian 的運算效能將達到 2 Exascale ,比起七個月前的預估還高出 30% 。