IBM :雖 Power 架構已具超凡 AI 性能,但 AI 成功關鍵在讓企業容易導入並具可靠、可擴展性

2017.12.20 08:17PM
是IBM :雖 Power 架構已具超凡 AI 性能,但 AI 成功關鍵在讓企業容易導入並具可靠、可擴展性這篇文章的首圖

在稍早 IBM 宣布與群環科技針對 IBM PowerAI 深度學習框架擴大合作時,筆者與 IBM 的 Power 處理器專家小小的聊了一下關於他們目前的硬體架構與 AI 產品戰略, IBM 認為,他們目前在硬體的架構已經相當領先,但光是硬體架構還不夠, IBM 的 PowerAI 計畫也提供了軟體與 AI 相關的最佳化,更重要的是 IBM 的架構還具備可擴展性。

是IBM :雖 Power 架構已具超凡 AI 性能,但 AI 成功關鍵在讓企業容易導入並具可靠、可擴展性這篇文章的第1圖

IBM 之所以對他們在 AI 的硬體性能有這麼大的信心,也仰賴 IBM 的 Power 架構, IBM 的 Power 架構不僅是採用針對超級電腦最佳化的設計,同時還透過 OpenPower 聯盟進行跨業界的結合,其中一項相當重要的是 NVIDIA 加入 OpenPower 聯盟,並且將目前 AI 最炙手可熱的 NVIDIA GPU 所具備的 NVLink 超高速通道導入。

 

雖然目前在許多為人工智慧設計的超級電腦中, NVIDIA 的 Pascal 與 Volta 架構 GPU 已經屢見不鮮,不過相較於 x86 架構, IBM Power 8 與 IBM Power 9 因為支援 NVLink ,故不僅獲得 CPU 與 GPU 直接相互溝通的能力,同時還可藉統一儲存記憶體,打破目前 AI 訓練最容易發生的加速器記憶體不足的情況。

 

在目前 x86 的人工智慧伺服器架構下,因為 GPU 與系統的記憶體是獨立的,雖然可藉由 MVIDIA 的 NVLink 將最多 8 張 GPU 的 HBM2 記憶體共享,但相較伺服器系統所具備的系統記憶體仍是相當小的,一旦深度學習所需的數據量過於龐大,就會造成系統當機。

是IBM :雖 Power 架構已具超凡 AI 性能,但 AI 成功關鍵在讓企業容易導入並具可靠、可擴展性這篇文章的第2圖

透過 IBM 與 NVIDIA 共同投入的 NVLink 通道技術後,不僅使 CPU 與 GPU 在運算獲得相互溝通的平等權,使運算流程不再需要回歸 CPU 後再行指揮,更重要的是能夠使 GPU 也使用到系統所撘載的大量 RAM ,並且藉由系統自動分配資料,將合適的資料分別存放在高速的 HBM2 與大容量的系統 RAM 上。

 

此外, IBM 所提供的 AI 解決方案不同於市場多數解決方案是以基於開源軟體搭配針對單機的運算方案, IBM PowerAI 解決方案可透過高速網路進行架構的橫向擴充,當企業的人工智慧需要更高的運算量,就不用受限於單一主機的運算力,僅需再擴充 Power AI 主機後即可使運算力再增加。

 

除了透過 NVLink 結合 NVIDIA GPU 以外, IBM 也在 Power 9 率先導入 PCIe 4.0 介面、 OpenCAPI 介面等,使各式的硬體加速器能夠透過新世代的快速通道與 Power 9 直接溝通,使客戶可依照需求彈性的擴充適合各類需求的加速器架構。

是GLOBALFOUNDRIES 宣布推出 2.5D HBM 解決方案,先以 14nm 展示並將整合到 7nm 製程設計系統這篇文章的首圖

而 IBM 認為除了硬體之外,最重要的是提供讓客戶能輕易使用的完整解決方案, IBM 不僅提供完整的軟體與框架工具,同時也在深度學習的培訓系統提供簡化,強調若僅是用於初階的影像辨識與分類,甚至可在 30 分鐘就完成培訓的前置準備、選擇模型並開始訓練,對於 IBM 的 AI 戰略來說,提供高性能的硬體只是基本,能夠簡化使用者的開發過程才是關鍵。

 

IBM 強調,若是電腦運算,勢必會得到結果,即便是 AI 也是一樣,但為何有許多深度學習的開發在訓練後無法得出結果,往往就是在深度學習的幾層之間的調教發生顧此失彼的狀況,因為深度學習採用的類神經網路就如同人類大腦一般,是以逐層方式作為邏輯。

是IBM :雖 Power 架構已具超凡 AI 性能,但 AI 成功關鍵在讓企業容易導入並具可靠、可擴展性這篇文章的第4圖

而許多不熟悉深度學習特性的開發者往往以為只要修復發現問題的層就可解決問題,不過卻忽視在其中一層修改後還需要連後續的層也一併修改,否則無法配合先前修改過的層,這會導致模型無法達到正確答案,使得範圍無限擴張而得不到答案, IBM 的解決方案中除了可偵測發生問題的層以外,也會提出必須隨之修改的相關層的建議。

 

至於 AI 架構是否會因為專屬的加速器出現而產生變化, IBM 的觀點則是趨向目前 AI 仍在成長期,雖然深度學習是市場大方向,但顯然在框架、學習語法都還在陸續推陳出新下,為了因應市場不斷的變化,具備彈性的可程式化架構仍較專屬的硬體加速器可適應急速變化的 AI 市場。

 

IBM 這次在台灣與在地合作夥伴群環科技合作 PowerAI 深度學習框架,也是為了讓客戶能夠藉由在地化的資源快速獲得 AI 相關的產業知識與企業資料,並且讓企業能依照不同的產業對於深度學習模型需求,並結合企業內部數據進行測試,體驗 AI 帶來的產業革新,使企業能夠評估並且容易實踐導入 AI 的企圖。