AMD 宣布 3D V-Cache 技術 Milan-X 第三代 AMD EPYC ,與 Multi Die 封裝、 OAM 介面的 Instinct MI200 加速器

2021.11.09 12:53AM
照片中提到了AMDA、AMD、PYC INSTINCT,跟Advanced Micro Devices公司、Advanced Micro Devices公司有關,包含了視覺、顯示裝置、視覺、牆紙、電腦

AMD 搶在 NVIDIA 的秋季 GTC 前一晚公布資料中心產品陣容,包括首度採用 3D CHIPLET 技術的第三代 V-CACHE 版 EPYC CPU " Milan-X ",以及針對加速運算與異構運算,採用 Multi-Die 設計的 Instinct MI200 系列加速器,同時還有針對超算異構連接與統一記憶體的第三代 AMD Infinity Architecture 技術。

▲ AMD EPYC 搭配 Instinct 的組合將是美國橡樹嶺實驗室下一代超算系統" Frontier "的基礎

▲ MI200 將率先出貨 OAM 介面的 MI250 與 MI250X ,採用 PCIe 的 MI210 則於日後推出

代號 Milan-X 的 3D V-Cache 版 EPYC 與使用 Open Accelerator Module 介面的 Instinct MI200 OAM 版皆預計在 2022 年第一季推出;另外針對傳統系統另將推出 PCIe 版的 AMD Instinct MI210 PCIe 系列。而 EPYC 處理器與  Instinct MI200 也將成為美國能源局與橡樹嶺實驗室新一代超算系統 Frontier 的基礎,該套系統將由 HPE 慧與科技負責架設與架構規劃。

照片中包含了勵志演講者、勵志演講者、言語、公開演講、現象

▲ Milan-X 是 AMD 基於第三代 EPYC 的特殊版本

照片中提到了ANNOUNCING TODAY、WORLD'S FIRST SERVER CPU、WITH 3D CHIPLET TEUNOLOGY,包含了階段、音樂會、事件、儀表、統計

▲ Milan-X 是全球首款使用 3D Chiplet 架構的伺服器處理器

照片中提到了INTRODUCING TODAY、

▲插槽與核心架構不變 ,但光是快取結構改為 3D V-Cache 就使效能大幅提升

照片中提到了3RD GEN AMD EPYC

▲強調效能仍遠勝對手同級產品

雖然架構上 3D V-Cache 版 EPYC 仍維持 Zen 3 架構,但 3D-Vcache 卻帶來莫大的效能提升,相同的工作流可提升約 50% 的效能;透過 3D V-Cache 封裝使得處理器與快取之間的傳輸途徑較 2D 封裝更為縮減,並可有效縮減晶圓平面面積, 3D V-Cache 版第三代 EPYC 的 L3 提升三倍容量,總快取達到 804MB ,但仍可與現行第三代 EPYC 使用相同的插槽。此外,微軟在活動宣布 Azure HBv3 虛擬機將採用 Milan-X 處理器,即日起開放開發者預覽,預計在近期宣布全面開放。

▲ Instinct MI200 晶片採用 Multi-DIE 設計

▲ CDNA2 採用 6nm 製程

照片中提到了AMD INSTINCT

▲ Instinct MI200 為 CDNA2 架構產品,電晶體高達 580 億個

照片中提到了AMD INSTINCT

▲採用 2.5D EFB 封裝,搭配 HBM2E 記憶體

AMD Instinct MI200 系列隸屬 AMD CDNA2 架構產品系列,採用台積電 6nm 製程,也是首款採用 Multi-Die 以及配有 128GB HBM2E 記憶體的 GPU 產品,具備高達 580 億個電晶體,同時為了實現統一記憶體架構與高速相互存取, AMD 亦提供採用開源的 OAM 介面技術產品; AMD IMI200 系列當中的 Instinct 250X 強調在 FP64 雙精度運算較競品高出 4.9 倍效能,而針對 AI 的 FP16 半精度運算可達 380 TFLOPS 。

照片中提到了SHATTERING PERFORMANCE、BARRIERS IN HPC & AI、INSTINCT,包含了屏幕截圖、屏幕截圖、顯示裝置、多媒體、字形

▲強調效能遠勝 NVIDIA A100 ,尤其雙精度相關性能大幅領先

照片中提到了8.9M、2.2X、19.5M,包含了黑暗、公共關係、介紹、字形、牌

▲標榜科學模擬運算性能遠超 NVIDIA A100

照片中提到了REMOVING、BARRIERS、PROGRAMMER,包含了世界、牌、產品、牆紙、現象

▲第三代 AMD Infinity Fabric 技術具備 CPU 、 GPU 多向溝通與統一記憶體的特性

AMD Instinct MI200 架構基於 AMD CDNA2 ,具備最高 220 個 CU ,具備整合 FP64 與 FP32 加速的最多 880 個第二代 Matrix Core ,相較上一代產品在 FP64 的峰值理論效能提高達 4 倍;同時透過 2.5D EFB ( Elevated Fanout Bridge )技術,帶來較前一代產品多出 1.8 倍的核心數量與 2.7 倍的記憶體頻寬,記憶體傳輸性能可達 3.2TB ;此外 AMD Instinct MI200  OAM 版可支援第三代 Gen AMD Infinity Fabric 技術,最多可達到 8 個 Infinity Fabric 鏈接,可與在迴圈內的第三代 EPYC CPU 與 GPU 構成統一記憶體。