當 2011 年 NVIDIA CEO 黃仁勳在 CES 親口證實他們正將 CUDA 與 ARM 64 位元架構整合在一起,預計於數年後推出的 Project Denver 在當時引發不少話題,當然也讓當時還未公佈 ARMv8 指令集的 ARM 傷透腦筋,因為這已經大幅超前當初 ARM 的產品公佈時程。
由於計畫細節始終未明朗,無論 ARM 與 NVIDIA 都不透露相關細節,隨著時間流逝, Project Denver 也慢慢的被其它訊息蓋過,直到 2011 年底 ARM 正式宣佈 ARMv8 指令集,以及去年公佈 Cortex-A50 架構與陸續有廠商支援 ARM 伺服器後,才有人再提到 Project Denver ,但 NVIDIA 仍不作聲,反而是 AMD 第一個跳出來表示將於 2014 年推出基於 ARMv8 的產品。
但今年 GTC ,黃仁勳在主題演講的產品規劃橋段時,正式透露 Project Denver 將於 2015 年以 Tegra " Parker "(蜘蛛人)的身份推出,基於 ARMv8 指令集自主設計的 Denver 核心搭配也預計於當年推出的最新 Maxell GPU 架構,在場歡聲雷動。
就像 CUDA 平行運算一樣, Project Denver 也是一個佈了很久的局,這個計畫不僅象徵著 ARM 架構有機會進軍 HPC (高效能運算),更意味著這個計畫若能成功, NVIDIA 在 HPC 領域不再只是提供平行運算選項配角,靠著具備 CPU 與 GPU 架構的 Parker SoC ,就能提供完整的運算方案。
也許有人會質疑,基本上還是針對行動運算市場規劃的 Parker 到底能作些什麼?的確, Parker 畢竟不是完全針對桌上型應用的產品線,理應不可能整合 GeForce Titan 等級的 GPU ,但別忘了 ARM 架構 Server 就是眾志成城的模式,一顆 Parker 不行,一群 Parker 可就不一樣了。
為了高效能運算等級的 Parker , NVIDIA 也在產品規劃先做好準備,光從 GPU 的產品規劃就有些徵兆,例如 Kepler 導入預先偵測下一步 Kernel 的 Dynamic Parallelism 技術,減少 GPU 與 GPU 之間的溝通,也可解釋為藉此減少 CPU 額外的負擔。至於 Maxell 架構更將首度導入 Unified Virtual Memory ,這項技術則有助於 CPU 與 GPU 更有效率的分配記憶體。
至於 Tegra 產品線方面,除了將於明年正式推出的次代產品 Logan 搶先用上支援 CUDA 、與桌上型架構相同的 Kepler 核心之外,採用 Tegra 3 搭配筆電級 Kepler 的 Kayla 開發板也是布局的一部分,透過先行推出 ARM + CUDA 的開發板,能讓軟硬體廠商搶先兩年的時間開始進行開發,而且一家義大利嵌入式系統廠商 SECO 更宣佈將於 4 月初推出 Kayla 主機板。
到底 ARM + CUDA 能否進軍 HPC ? 筆者個人雖不敢掛保證,但從 ARM 近期在 Server 的進度應該是相當有機會的,包括百度、 Facebook 將導入實做外,HP、Dell、Mitec 伺服器供應商,AMD 、 Calxeda 等處理器供應商也都宣佈將導入 ARMv8 架構的伺服器懷抱, NVIDIA 有著至今已經 5 年的 CUDA 平行運算基礎作為後盾,也在市場逐漸證實 CUDA 可以創造的價值。
也有認識的朋友問筆者,這樣的方案難道用 Atom 搭配 Kepler 不行嗎?答案當然是可以,只是 NVIDIA 更想向世界證明 x86 與 Cell 之外, HPC 的 CPU 還有更多的選擇,而 NVIDIA 未來還可提供一顆整合高效能 CPU 與運算級 GPU 的 SoC 。
從 GPU 到 Tegra ,再到 Project Denver ,也許是 NVIDIA 已經不甘只作陪襯,也或許是 CEO 黃仁勳已經預見未來的日子不可能依賴 x86 一輩子,回過頭去檢視近年 NVIDIA 的產品規畫,都會覺得當初的一些產品設計都是為了往後的布局,而且當時的承諾最終也真的都化為現實,離 Parker 雖還有將近兩年的時間,但已經讓人期待 Parker 將會如何顛覆 HPC 的世界。