NVIDIA 日前推出新一代的超算與機器學習加速器 NVIDIA A100 ,藉由全新架構與更強大的機器學習加速架構,使其成為當前業界最高性能的產品;當然業界最強也不能自己說了算,由機器學習業界測試機準 MLPerf 公布的最新成績, NVIDIA A100 Tensor Core GPU 在 8 項基準測試創下紀錄,同時基於 NVIDIA A100 的 DGX SuperPOD 系統亦創下 8 項效能紀錄,更值得關注的是 NVIDIA 是當前唯一一家以市售產品而非預覽或開發中產品送測的公司。
MLPerf 是由業界包括亞馬遜、百度、 Facebook 、 Google 、哈佛大學、 Intel 、微軟、史丹佛大學等組織機構共同支持,以 AI 技術的發展持續調整測試方式,也是現階段最公正的高效能 AI 測試項目。
▲ NVIDIA A100 在 8 項測試創下紀錄
▲ NVIDIA 在 1 年半藉新硬體與軟體持續更新時間使性能提升 4 倍
固然新硬體的出現很重要,但更重要的是 NVIDIA 持續對軟體的更新與強化帶來更高的效能,在 1 年半的時間內,以搭載 NVIDIA V100 的 DGX-1 藉由相同吞吐量數據進行測試,效能較先前提升兩倍。
而新一代架構 NVIDIA A100 憑藉著新架構與 Mellanox HDR 200Gb/s InfiniBand 的網路互連技術,較 1 年半前的 DGX-1 系統提升達 4 倍性能。
▲ NVIDIA GPU 加速技術在推薦系統、對話式 AI、強化學習領域在等新興應用表現也相當出色
MLPerf 在最新的測試機種中,因應 AI 應用需求導入兩項新測試項目,與一項因應技術變革的大改版測試項;兩項新測試當中是推薦系統,另一項則是基於 BERT 的對話式 AI ,大改版測試項則是採用 Mini-go 以及 19x19 全尺寸 Go 機板的強化學習。
除了數據出色外, NVIDIA 的 GPU 加速器也在現實應用繳出漂亮的成績,阿里巴巴在去年雙 11 創下 380 億美金的銷售紀錄,其中採用 NVIDIA GPU 的推薦系統扮演重要的角色,相較 CPU 推薦系統提升 100 倍性能;同時許多金融、服務與醫界也導入基於 NVIDIA GPU 的對話 AI 技術,使其降低人力客服的負擔。
▲ NVIDIA 提供廣泛 AI 應用框架,協助產業快速建構 AI 系統
NVIDIA 也在今年發表 NVIDIA A100 之際,宣布兩項適用於推薦系統與對話式 AI 的應用框架,分別是推薦系統用的 Merlin 與對話式 AI Jarvis ,其中 Merlin 整合最新 MLPerf 測試成果的 HugeCTR 訓練框架;這兩項新應用框架與先前已經宣布的車用 NVIDIA DRIVE 、醫療用的 Clara 、機器人領域的 Isaac 、零售/ 智慧城市的 Metropolis 構成更完整的應用框架振榮。
▲ Selene 是 NVIDIA 採用 DGX SuperPOD 建構的自建 HPC 叢集
NVIDIA 此次也讓自建 HPC 與 AI 叢集 Selene 作為 MLPerf 測試的系統,藉由 DGX SuperPOD 快速架設完成的 Selene 也在上線後成為 TOP500 榜單北美性能最高的工業系統,也是 Green 500 節能榜單的第二名,具超過 1 exaflops AI 效能。
許多客戶也陸續使用採用 DGX POD 、 DGX SuperPOD 建構新一代系統,包括美國最快的學術用 AI HPC HiPerGator ,而超級電腦中心阿貢實驗室也率先導入 A100 GPU ,用於研究對抗武漢肺炎的運算模擬。此外如大陸集團 Continental ,航太的洛克希德馬丁、微軟、 Google 等也都加入 NVIDI A100 與 DGX SuperPOD 的使用者行列。