由於今年包括 Summit 與 Sierra 還有台灣杉 2 等多款基於 NVIDIA GPU 加速的超級電腦陸續上線並在 Top 500 大放異彩,使 NVIDIA 在 SC18 備受注目,而除了展示包括 DGX-2 伺服器、 Tesla V100 、 Tesla T4 等硬體之外, NVIDIA 在 SC18 的攤位相當著重在溝通 NGC 與 RAPIDS 兩項平台上,畢竟 NGC 透過預完成的容器讓開發者快速設立系統,而 RAPIDS 則有效的使多 GPU 運算的效能能夠線性提升,對於 GPU 運算有相當大的幫助。
在 NGC 的展示攤位上, NVIDIA 展示如何從 NGC 下載容器安裝所需要的功能,並將 4TB 的星系模擬數據進行分析演算,再將結果透過多台 DGX 伺服器進行即時渲染產生可視化的即時 3D 星系影像,藉由 NGC 所提供的容器,研究者不需要從頭進行軟體設置,只要下載並安裝好容器與提供資料,即可完成所需的數據分析與模擬。
至於 RAPIDS 則能夠進一步發揮 GPU 運算的價值,解放多 GPU 的 In GPU Memory 運算,將大量的運算資料直接在高速的 GPU 的記憶體進行,不用再反覆地將資料從 GPU 回傳到 CPU 上的 RAM 或是硬碟,同時能夠管理跨系統的多 GPU 運算流程,並以可視化的柱狀圖顯示當前各個 GPU 的運算負載, RAPIDS 對於使用如 Google Cloud 等雲運算服務來說,能使如影像辨識、深度學習或是資料分析等透過租用更多 GPU 的方式加速訓練與分析流程。
當然 NVIDIA 也不忘在現場展示 DGX-2 伺服器, DGX-2 伺服器之所能夠串接達兩套 NVLink 上共 16 個 GPU 的運算能力與共享記憶體的關鍵,就是 NVSwitch 晶片,透過在兩套 NVLink 的 8 顆 GPU 搭配 6 個 NVSwitch ,使得原本位於兩套 NVLink 的 GPU 也能達到全速的相互連接,也構成一個單一的大型 GPU 加速器。