藉由認證計畫確保高效能且開箱即用的 AI 系統, NVIDIA 攜手 OEM 推出全球首批 NVIDIA 認證 AI 系統

2021.01.27 01:00AM
照片中提到了NVIDIA,、CERTIFIED,跟英偉達有關,包含了英偉達cuda、圖形處理單元、卡達、軟件

隨著 GPU 與加速器等異構運算的世代到來,現在 AI 運算已經不再是只有國家級機構級的實驗室才有辦法負擔,金融機構、企業與醫療體系也能夠負擔 AI 系統,然而 AI 系統架構複雜,企業也會擔心採購之後能否順利導入與可靠問題, 作為當前 GPU AI 加速的領導廠商, NVIDIA 攜手全球頂尖 OEM 廠商推出首批 NVIDIA 認證系統,針對現代化的 AI 工作流透過機器學習與分析實測,確保使用品質與可靠性。

照片中提到了INspur、GIGABYTE

▲首波通過 NVIDIA 認證之 NVIDIA A100 Tensor GPU 伺服器系統

包括 Dell 、技嘉( Gigabyte )、慧與( HPE )、 Inspur 、美超微( Supermicro )等 OEM 客戶皆宣布推出 NVIDIA 認證計畫的伺服器,其中搭載 NVIDIA A100 Tensor GPU 的系統包括 Dell EMC PowerEdge R7525 與 R740 機架式伺服器、 GIGABYTE R281-G30、R282-Z96、G242-Z11、G482-Z54、G492-Z51 系統、 HPE Apollo 6500 Gen10 系統及 HPE ProLiant DL380 Gen10 伺服器、 Inspur NF5488A5 、Supermicro A+ 系統 AS-4124GS-TNR 及 AS-2124GQ-NART 。

NVIDIA 認證計畫是作為確保企業 AI 所需的效能、可程式化特性與安全處理能力,硬體部分結合 NVIDIA Ampere 架構之 A100 Tensor GPU 與 NVIDIA Mellanox 高速網路解決方案,需要通過包括使用多節點運算到單一 GPU 運算的任務進行各種作業負載測試,須能執行 NGC 目錄當中的 AI 應用程式,包括深度學習訓練與推論、機器學習演算法、智慧影像分析、網路與儲存裝置卸載等項目,以 NGC 目錄熱門的 AI 框架與容器為測試項,透過實際使用的情境做為測試項目,使每套通過 NVIDIA 認證的系統在與全球最強大的 AI 系統有一致性的條件下能執行相同的軟體內容。

照片中提到了DELLTechnologies、Hewlett Packard、Enterprise,跟戴爾技術、技嘉科技有關,包含了英偉達cuda、產品、牌、儀表、多媒體

▲首批通過認證的 14 款機型由 6 家系統 OEM 推出

NVIDIA 認證之資料中心伺服器包括 8 個 A100 Tensor GPU 與高速 InfiniBand 或乙太網路介面卡, OEM 廠商將透過 NVIDIA Mellanox 電纜、交換機、與像是 ConnectX-6 InfiniBand 或乙太網路介面卡和
BlueField-2 DPU 等網路卡對系統進行認證,其中必定需要以 NVIDIA Mellanox 8700 HDR 200G InfiniBand 交換機或 Mellanox SN3700 乙太網路交換機進行驗證。這些網路卡除了具低延遲、高處理量的特色,也確保自啟動的硬體信任根至應用程式的連結追蹤。

除了首批 6 家系統 OEM 共 14 台伺服器取得 NVIDIA 認證外,當前共有 11 家系統製造商、超過 70 套系統參與認證計畫,後續在完成測試認證後也會陸續增加認證機種。