NVIDIA 去年在 GTC 大會上所介紹的次代 GPU 架構 Pascal 正式在今年商用化,首款採用此架構的產品是專業加速器 Tesla P100 ,此款 GPU 可說是鎖定超級運算與深度學習領域,強調相較於 Maxwell 架構,於深度學習可加速達 12 倍的效能,並且以全新的半精度指令可在深度學習提供超過 21 兆次浮點數的高效能。黃仁勳也宣布一線伺服器品牌採用 Tesla P100 的伺服器將於 2017 年第一季推出。
Tesla P100 採用全新的 Pascal 架構, 以 16nm FinFET 製程生產,高達 153 億個電晶體,最大的特色是導入三星 16GB HBM2 記憶體以及 NVLink ,採用 CoWOS 製程的 HBM2 為 P100 帶來最大的助益是帶來相較傳統 GDDR5 3 倍頻寬,可達 720GB/s 的傳輸速度。
Tesla P100 具備高達 1500 億的 XTORS , 5.3TF FP64 , 10.6TF FP32 , 21.2TF FP ,同時具備 14MB SM RF 以及 4MB L2 Cache 。
至於 NVLink 則允許 GPU 與 CPU 、 GPU 與 GPU 的相互溝通,頻寬比起傳統溝通模式提升 5 倍頻寬,並最高可達 8GPU 的直接相互連接,同時與同樣支援 NVLink 的 IBM POWER 8 CPU 可直接進行溝通。
另外隨採用 Pascal 架構的 Tesla P100 發表, NVIDIA 也宣布六月將推出的 CUDA 8 指令集以及四月將推出的 CuDNN 第五版支援 Pascal 架構, CUDA 8 同時提供針對圖像分析的函式庫 nvGRAPH (六月正式推出),可用於包括機器人路徑分析、網路安全與邏輯分析功能; cuDNN 則加速回饋式類神經網路和特別針對醫學、油氣探勘以及其他領域所需的最佳化。
你或許會喜歡