硬科技：集AMD技術之大成的超級電腦APU：EHP (下) (154977)

照片中提到了匪0 aE 98 92 BE 3、EENIE EE IE E8IS BI 18 81、HBM Stacks，包含了AMD小芯片、Advanced Micro Devices公司、中央處理器、多芯片模塊、電腦

既然AMD看起來決定打造「超高階APU」，那想必各位科科頭上馬上浮現一個大大的問號：這東西要拿來作什麼？又準備要賣給誰？

前情提要：集AMD技術之大成的超級電腦APU：EHP (上)

這些年來，AMD一直有個「說不出的痛」：在超級電腦市場幾乎銷蹤匿跡。

以今年6月的Top 500榜單來說，相較於滿山滿谷的Intel CPU和NVIDIA GPU，用到AMD CPU的只有「10台」，而GPU就更尷尬了，才區區「1台」裝了Radeon Vega。要不是因Zen 2世代的EPYC吸引了不少超級電腦新案，像突破2ExaFlops的美國國家核能安全管理局的El Capitan等等，堂堂AMD在Top 500只佔有如此零頭的份額，怎麼說也說不過去。

硬科技：一窺NVIDIA「真正人工智慧」Volta的執行單元細節
 硬科技：從地球模擬器到Summit：被GPU顛覆的超級電腦賽豬公

AMD將其定位為「Exascale」，當然不是區區1顆超級暴力的APU就可搞定(否則全世界所有超級電腦設計者大概都要跳樓了)，而是眾志成城，預計在2022到2023年，用10萬顆EHP與20MW的耗電量，實現Peta等級的1000倍效能。

按照AMD的公開論文，預期1顆EHP會有8顆32 CU(1個CU包含64個串流處理器)的GPU，總計256個CU與16384個串流處理器，當時脈為1GHz時，提供16TeraFlops的雙倍浮點精確度理論運算效能，10萬顆就是1.6ExaFlops。

AMD也有藉由模擬手段，評估不同GPU組態(數量、時脈、記憶體頻寬)在執行多種應用程式時的能耗比，畢竟這會決定這台超級電腦的長期使用電費是否值得。以AMD的論文內容來說，他們認定32個CPU核心、320個時脈1GHz的GPU CU(20480個串流處理器)、3TB/s記憶體頻寬、160W功耗，是當時最適當的設定。

記憶體階層架構則是EHP另一個值得關注的重點，特別是斷電後資料不會消失的NVRAM(Non-Volatile RAM)和「記憶體內運算」的PIM(Processing-In-Memory)。

眼尖的科科一定會注意到：記憶體不限於封裝在APU的HBM，還有外部的DRAM、NVRAM(如Intel/Micro的3D Xpoint和發展中的SST-MRAM等)與內建位元運算電路的計算記憶體(Processing in Memory)，該想到的幾乎都想到了。

計算記憶體專屬的快取資料一致性協定(Cache Coherence Protocol)，也是AMD相關7份專利中的其中一篇。

像EHP的動態記憶體管理和省電機能(看起來跟SmartShift頗有關連)也成為AMD的專利。

以前提到過3D封裝不易散熱的問題，AMD也提出了相關的專利設法解決，如塞入導熱層、佈置導熱用的假矽穿孔(Dummy Through-Silicon Vias)、熱電冷卻(Thermoelectric Cooling)與更完善的熱量管理機制等。

硬科技：談談Intel的多晶片水餃封裝技術

言歸正傳，這看起來超像外星科技的EHP，AMD尚未公佈其產品化時程，但相關技術將提前應用在主流處理器的傳言(像Zen3世代EPYC「Milan」就傳聞不斷)，卻從來沒有停止過。但無論如何，上看下看左看右看，AMD的EHP都比慘遭腰斬的Intel Xeon Phi來得實際可行多了。至於AMD要如何補強在軟體層面的大弱點，將是決定他們能不能追上nVidia的最重要關鍵。

硬科技：Intel邁向人工智慧晶片的一小步：Knights Mill

最後，當年AMD併購ATI後過沒多久，某天筆者就做了個夢：AMD把超級多的CPU核心、更多的GPU和DRAM，一組組的疊在一起，還想到叫做「Impression」的奇怪代號。曾幾何時，筆者的黃粱一夢，卻可能成為Intel的天大惡夢，實在讓人始料未及。

反倒是靠著「未來性」而在近期市值超越Intel的nVidia，他們未來在超級電腦的布局，難道就沒思考過一個可能性嗎：在未來的高階GPU內，直接塞入高效能ARM或RISC-V指令集相容處理器，使其成為一個「主動的系統」，無須成為CPU的依附品？

搞不好這件事情已經是現在進行式，只是筆者不知、科科不曉，科科科科科。

深入閱讀

6 則回應

司馬雲

現在看到nvidia併購arm，看起來GPU裡塞入ARM不是不可能了

2020-10-22
nicalbaby

大大的這個夢, intel的lakefield算是實現了嗎?

2020-07-15
黃凱麟

取代NV的地位

2020-07-15
龍志芳

當桌機會不會更實惠

2020-07-15
廖國龍

把Vega 10拿來當chiplet用，面積是大了點，應該用Vega 20才對。

甚至，AMD應該開發跟CPU Chiplet差不多大小的GPU Chiplet，然後依據客戶需求，組合成客製化APU才對。(面積一致組合的彈性才大)

2020-07-14
- ALLEN
  
  CPU Die面積一樣大的GPU性能太爛,而現有CPU封裝的GPU性能又實際受限於記憶體頻寬,換上高頻率記憶體的桌面版Renoir顯示性能可以比筆電版漲50%就可以知道為什麼INTEL要搞edram
  
  2020-07-20

猜你喜歡

深入閱讀

6 則回應

痴漢水球

相關消息