GTC 2016 ：導入 NVLink 與 HBM2 ， NVIDIA 發表採 Pascal 架構專業加速器 Tesla P100 (104753)

是挹注 NVIDIA GPU 加速效能更強勁， Google 雲端平台宣布導入 Tesla P100 、 Tesla K80 加速這篇文章的首圖

NVIDIA 去年在 GTC 大會上所介紹的次代 GPU 架構 Pascal 正式在今年商用化，首款採用此架構的產品是專業加速器 Tesla P100 ，此款 GPU 可說是鎖定超級運算與深度學習領域，強調相較於 Maxwell 架構，於深度學習可加速達 12 倍的效能，並且以全新的半精度指令可在深度學習提供超過 21 兆次浮點數的高效能。黃仁勳也宣布一線伺服器品牌採用 Tesla P100 的伺服器將於 2017 年第一季推出。

Tesla P100 採用全新的 Pascal 架構，以 16nm FinFET 製程生產，高達 153 億個電晶體，最大的特色是導入三星 16GB HBM2 記憶體以及 NVLink ，採用 CoWOS 製程的 HBM2 為 P100 帶來最大的助益是帶來相較傳統 GDDR5 3 倍頻寬，可達 720GB/s 的傳輸速度。

Tesla P100 具備高達 1500 億的 XTORS ， 5.3TF FP64 ， 10.6TF FP32 ， 21.2TF FP ，同時具備 14MB SM RF 以及 4MB L2 Cache 。

至於 NVLink 則允許 GPU 與 CPU 、 GPU 與 GPU 的相互溝通，頻寬比起傳統溝通模式提升 5 倍頻寬，並最高可達 8GPU 的直接相互連接，同時與同樣支援 NVLink 的 IBM POWER 8 CPU 可直接進行溝通。

另外隨採用 Pascal 架構的 Tesla P100 發表， NVIDIA 也宣布六月將推出的 CUDA 8 指令集以及四月將推出的 CuDNN 第五版支援 Pascal 架構， CUDA 8 同時提供針對圖像分析的函式庫 nvGRAPH (六月正式推出)，可用於包括機器人路徑分析、網路安全與邏輯分析功能； cuDNN 則加速回饋式類神經網路和特別針對醫學、油氣探勘以及其他領域所需的最佳化。

你或許會喜歡

網路限定！首年299上網吃到飽即將停止申辦

小片幅的先驅、微觀世界的王者，看 Olympus 如何打造屬於自己的光學王國