既然AMD看起來決定打造「超高階APU」,那想必各位科科頭上馬上浮現一個大大的問號:這東西要拿來作什麼?又準備要賣給誰?
這些年來,AMD一直有個「說不出的痛」:在超級電腦市場幾乎銷蹤匿跡。
以今年6月的Top 500榜單來說,相較於滿山滿谷的Intel CPU和NVIDIA GPU,用到AMD CPU的只有「10台」,而GPU就更尷尬了,才區區「1台」裝了Radeon Vega。要不是因Zen 2世代的EPYC吸引了不少超級電腦新案,像突破2ExaFlops的美國國家核能安全管理局的El Capitan等等,堂堂AMD在Top 500只佔有如此零頭的份額,怎麼說也說不過去。
硬科技:一窺NVIDIA「真正人工智慧」Volta的執行單元細節
硬科技:從地球模擬器到Summit:被GPU顛覆的超級電腦賽豬公
AMD將其定位為「Exascale」,當然不是區區1顆超級暴力的APU就可搞定(否則全世界所有超級電腦設計者大概都要跳樓了),而是眾志成城,預計在2022到2023年,用10萬顆EHP與20MW的耗電量,實現Peta等級的1000倍效能。
按照AMD的公開論文,預期1顆EHP會有8顆32 CU(1個CU包含64個串流處理器)的GPU,總計256個CU與16384個串流處理器,當時脈為1GHz時,提供16TeraFlops的雙倍浮點精確度理論運算效能,10萬顆就是1.6ExaFlops。
AMD也有藉由模擬手段,評估不同GPU組態(數量、時脈、記憶體頻寬)在執行多種應用程式時的能耗比,畢竟這會決定這台超級電腦的長期使用電費是否值得。以AMD的論文內容來說,他們認定32個CPU核心、320個時脈1GHz的GPU CU(20480個串流處理器)、3TB/s記憶體頻寬、160W功耗,是當時最適當的設定。
記憶體階層架構則是EHP另一個值得關注的重點,特別是斷電後資料不會消失的NVRAM(Non-Volatile RAM)和「記憶體內運算」的PIM(Processing-In-Memory)。
眼尖的科科一定會注意到:記憶體不限於封裝在APU的HBM,還有外部的DRAM、NVRAM(如Intel/Micro的3D Xpoint和發展中的SST-MRAM等)與內建位元運算電路的計算記憶體(Processing in Memory),該想到的幾乎都想到了。
計算記憶體專屬的快取資料一致性協定(Cache Coherence Protocol),也是AMD相關7份專利中的其中一篇。
像EHP的動態記憶體管理和省電機能(看起來跟SmartShift頗有關連)也成為AMD的專利。
以前提到過3D封裝不易散熱的問題,AMD也提出了相關的專利設法解決,如塞入導熱層、佈置導熱用的假矽穿孔(Dummy Through-Silicon Vias)、熱電冷卻(Thermoelectric Cooling)與更完善的熱量管理機制等。
言歸正傳,這看起來超像外星科技的EHP,AMD尚未公佈其產品化時程,但相關技術將提前應用在主流處理器的傳言(像Zen3世代EPYC「Milan」就傳聞不斷),卻從來沒有停止過。但無論如何,上看下看左看右看,AMD的EHP都比慘遭腰斬的Intel Xeon Phi來得實際可行多了。至於AMD要如何補強在軟體層面的大弱點,將是決定他們能不能追上nVidia的最重要關鍵。
最後,當年AMD併購ATI後過沒多久,某天筆者就做了個夢:AMD把超級多的CPU核心、更多的GPU和DRAM,一組組的疊在一起,還想到叫做「Impression」的奇怪代號。曾幾何時,筆者的黃粱一夢,卻可能成為Intel的天大惡夢,實在讓人始料未及。
反倒是靠著「未來性」而在近期市值超越Intel的nVidia,他們未來在超級電腦的布局,難道就沒思考過一個可能性嗎:在未來的高階GPU內,直接塞入高效能ARM或RISC-V指令集相容處理器,使其成為一個「主動的系統」,無須成為CPU的依附品?
搞不好這件事情已經是現在進行式,只是筆者不知、科科不曉,科科科科科。
6 則回應
甚至,AMD應該開發跟CPU Chiplet差不多大小的GPU Chiplet,然後依據客戶需求,組合成客製化APU才對。(面積一致組合的彈性才大)