GTC 2017 : NVIDIA 為何在 Tesla V100 以及 Xavier 導入 TensorFlow 加速器

2017.05.11 10:24AM
是GTC 2017 : NVIDIA 為何在 Tesla V100 以及 Xavier 導入 TensorFlow 加速器這篇文章的首圖

NVIDIA 在今年 GTC 大會,正式宣布首款基於 Volta 架構的 GPU 產品 Tesla V100,同時也針對去年所發表的新一代自動駕駛車平台 Xavier 進行技術規格更新,而此次兩個基於 Volta 架構的產品最大的特色就是在架構中導入針對深度學習框架 TensorFlow 的加速器,也不禁令人好奇為何需要在架構中融合加速器。

去年 Google已經宣布將針對 TensorFlow開發名為 TPU 的 ASIC 加速器,而 Tesla V100 的 Tensor Core 以及 Xavier 中的 Xavier DLA 也是類似的意義,皆是專為 TensorFlow 最佳化的硬體加速架構。

而 NVIDIA 在這兩款產品中導入加速器的用意,就是希望藉此針對這兩款產品應用在深度學習相關的領域時,能利用加速器的特性達到高效率、低能耗的目的,但也因為 Tesla V100 與 Xavier 都不只是單純為深度學習所開發,故不可能將整個架構完全置換成全加速器核心設計。

2b887798eb7802e96837197d3f6f9b2c

Tesla V100 的目標應用主要還是應用在如 HPC 、 AI 、工作站等應用,而加入加速器的用意則是讓 Tesla V100 能夠在這些應用需要結合深度學習時,既維持原本 CUDA 在高效能運算或是圖形運算的效能,但又能夠在深度學習的部分更具效率;而且將 Tensor Core 直接融合到 SM 單元內,相較 Google 的 TPU 採用與運算核心外接的方式,能夠大幅增加運算結果相互溝通的效率。

3f36b2a3baa80c10e37509eb7c0c52de

至於 Xavier 雖是主打自動駕駛的次世代平台,深度學習固然重要,但也還要一併處理包括影像分析與決策的部分,是故藉由融合 Xavier DLA 加速器使深度學習效率提升也是相當合理的手段。

81ff1dd7c53aa121a8900a7bceb70b46

從 NVIDIA 此次硬體架構的規劃來看,若是涉及到深度學習的應用與硬體架構,藉由配合或是加入專為 TensorFlow 的加速器已經是趨勢,但畢竟 TensorFlow 也是整個人工智慧的一環而非全部,也不可能只靠加速器維持整個系統,而 NVIDIA 在這兩款產品加入深度學習的加速器,就宛若當初在 GPU 當中加入針對影像編碼的硬體解碼有類似的意義,透過針對特定領域的最佳化架構達到效能的提升,把運算資源活用在更合理的領域。

不過目前兩個具備加速器設計的核心皆是以特定應用領域而生,未來若是針對偏消費端應用的產品線,例如 GeForce 、 Quadro 或是 Tegra ,也不確定當 Volta 開始導入之後,會否在架構上省卻深度學習加速器的部分,不過以稍早大會上提及將深度學習應用在 Ray Tracing 領域,或許未來就連遊戲娛樂也可能會使用到 TensorFlow 也不一定。