NVIDIA 以採用 NVIDIA A100 的市售系統在機器學習測試基準 MLPerf 創下 16 項紀錄 (155317)

照片中提到了FIELD-PROVEN SCALE、WITH NVIDIA DGX PODS、Argonne，跟英偉達、藤農有關，包含了建築、顯卡、圖形處理單元、安培

NVIDIA 日前推出新一代的超算與機器學習加速器 NVIDIA A100 ，藉由全新架構與更強大的機器學習加速架構，使其成為當前業界最高性能的產品；當然業界最強也不能自己說了算，由機器學習業界測試機準 MLPerf 公布的最新成績， NVIDIA A100 Tensor Core GPU 在 8 項基準測試創下紀錄，同時基於 NVIDIA A100 的 DGX SuperPOD 系統亦創下 8 項效能紀錄，更值得關注的是 NVIDIA 是當前唯一一家以市售產品而非預覽或開發中產品送測的公司。

MLPerf 是由業界包括亞馬遜、百度、 Facebook 、 Google 、哈佛大學、 Intel 、微軟、史丹佛大學等組織機構共同支持，以 AI 技術的發展持續調整測試方式，也是現階段最公正的高效能 AI 測試項目。

▲ NVIDIA A100 在 8 項測試創下紀錄

▲ NVIDIA 在 1 年半藉新硬體與軟體持續更新時間使性能提升 4 倍

固然新硬體的出現很重要，但更重要的是 NVIDIA 持續對軟體的更新與強化帶來更高的效能，在 1 年半的時間內，以搭載 NVIDIA V100 的 DGX-1 藉由相同吞吐量數據進行測試，效能較先前提升兩倍。

而新一代架構 NVIDIA A100 憑藉著新架構與 Mellanox HDR 200Gb/s InfiniBand 的網路互連技術，較 1 年半前的 DGX-1 系統提升達 4 倍性能。

▲ NVIDIA GPU 加速技術在推薦系統、對話式 AI、強化學習領域在等新興應用表現也相當出色

MLPerf 在最新的測試機種中，因應 AI 應用需求導入兩項新測試項目，與一項因應技術變革的大改版測試項；兩項新測試當中是推薦系統，另一項則是基於 BERT 的對話式 AI ，大改版測試項則是採用 Mini-go 以及 19x19 全尺寸 Go 機板的強化學習。

除了數據出色外， NVIDIA 的 GPU 加速器也在現實應用繳出漂亮的成績，阿里巴巴在去年雙 11 創下 380 億美金的銷售紀錄，其中採用 NVIDIA GPU 的推薦系統扮演重要的角色，相較 CPU 推薦系統提升 100 倍性能；同時許多金融、服務與醫界也導入基於 NVIDIA GPU 的對話 AI 技術，使其降低人力客服的負擔。

▲ NVIDIA 提供廣泛 AI 應用框架，協助產業快速建構 AI 系統

NVIDIA 也在今年發表 NVIDIA A100 之際，宣布兩項適用於推薦系統與對話式 AI 的應用框架，分別是推薦系統用的 Merlin 與對話式 AI Jarvis ，其中 Merlin 整合最新 MLPerf 測試成果的 HugeCTR 訓練框架；這兩項新應用框架與先前已經宣布的車用 NVIDIA DRIVE 、醫療用的 Clara 、機器人領域的 Isaac 、零售/ 智慧城市的 Metropolis 構成更完整的應用框架振榮。

▲ Selene 是 NVIDIA 採用 DGX SuperPOD 建構的自建 HPC 叢集

NVIDIA 此次也讓自建 HPC 與 AI 叢集 Selene 作為 MLPerf 測試的系統，藉由 DGX SuperPOD 快速架設完成的 Selene 也在上線後成為 TOP500 榜單北美性能最高的工業系統，也是 Green 500 節能榜單的第二名，具超過 1 exaflops AI 效能。

許多客戶也陸續使用採用 DGX POD 、 DGX SuperPOD 建構新一代系統，包括美國最快的學術用 AI HPC HiPerGator ，而超級電腦中心阿貢實驗室也率先導入 A100 GPU ，用於研究對抗武漢肺炎的運算模擬。此外如大陸集團 Continental ，航太的洛克希德馬丁、微軟、 Google 等也都加入 NVIDI A100 與 DGX SuperPOD 的使用者行列。

Chevelle.fu

猜你喜歡

Chevelle.fu

相關消息