AMD 於 SC20 宣布第一款 CDNA 架構加速器 Instinct MI100 ,具 10 TFLOPS 以上之 FP64 算力

2020.11.17 05:01PM
照片中提到了AMDA、INSTINCT,跟Advanced Micro Devices公司有關,包含了圖形處理單元、英偉達、電腦、AMD Radeon本能Mi25加速器Q1K38A

AMD 日前宣布旗下 GPU 計劃藍圖時,確立在加速運算將採取與消費級 RDNA 架構不同的分支,並將加速運算架構命名為 CDNA ,此次藉 SC20 大會宣布首款採用 CDNA 架構產品 AMD Instinct MI100 ,宣稱將為運算產業帶來創新變革,更為第一款在 FP64 可達 10 TFLOPS 運算力的 GPU 產品,在搭配 AMD EPYC 、 ROCm 4.0 開放軟體平台,能為即將到來的 exascale 層級超算提供充裕的運算效能。

美國橡樹嶺實驗室成為率先使用 AMD Instinct MI100 的前導使用者,強調比當前其他 GPU 高出 2-3 倍效能。

照片中提到了TM、AMD Instinct™ MI100*、FP32,包含了角度、產品設計、黑白/ M、儀表、單色

▲ AMD Instinct MI100 官方規格

AMD Instinct MI100 具備 7,680 個流處理器,配有 1.23TB 頻寬之 32GB HBM2 記憶體,為 HPC 與 AI 開發全新 Matric Core ,能針對如 FP32、FP16、bFloat16、Int8、以及 Int4 等全範圍單精度、混合精度矩陣運算進行強化,藉由支援第 2 代 AMD Infinity Fabric ,能夠在使用 3 組 AMD Infinity Fabric 於 PCIe 4.0 提供兩倍的 P2P 峰值 I/O 、丹卡 340Gbps 總頻寬,並於伺服器架構能夠配備兩組完全連接、具 552GBps 頻寬之 Quad GPU ( hives ) 。

照片中跟Calzedonia有關,包含了地板、圖形處理單元、顯卡、Advanced Micro Devices公司、處理器

▲ AMD Instinct MI100 是首款 CDNA 架構 GPU 加速器

AMD 強調, Instinct MI100 搭配 AMD 第二代 EPYC 平台之下,能夠為 AI 與超算提供跨時代的運算效能,除了具備 11.5 TFLOPS 的 FP64 、 23.1 TFLOPS FP32 峰值效能外,於 AI 以及機器學習領域具備 46.1 TFLOPS 的 FP32 Matrix 峰值效能,兩項數據皆優於 NVIDIA A100 40GB 版本,另於 AI 訓練之 FP16 運算,藉由 AMD Matrix Core ,能比起上一代 AMD Instinct 加速器提供 7 倍算力。

同時, AMD 也進一步強化其 ROCm 開發者軟體,經過最佳化的 ROCm 4.0 將編譯器升級到支援開源與統支支援 OpenMP 5.0 與 HIP ,同時如 PyTorch 、 Tensoprflow 框架也為 ROCm 4.0 提供最佳化,進一步發揮 Instinct MI100 的效能。