硬科技:集AMD技術之大成的超級電腦APU:EHP (下)

2020.07.14 06:23PM
照片中提到了匪0 aE 98 92 BE 3、EENIE EE IE E8IS BI 18 81、HBM Stacks,包含了AMD小芯片、Advanced Micro Devices公司、中央處理器、多芯片模塊、電腦

既然AMD看起來決定打造「超高階APU」,那想必各位科科頭上馬上浮現一個大大的問號:這東西要拿來作什麼?又準備要賣給誰?

前情提要:集AMD技術之大成的超級電腦APU:EHP (上)

這些年來,AMD一直有個「說不出的痛」:在超級電腦市場幾乎銷蹤匿跡。

以今年6月的Top 500榜單來說,相較於滿山滿谷的Intel CPU和NVIDIA GPU,用到AMD CPU的只有「10台」,而GPU就更尷尬了,才區區「1台」裝了Radeon Vega。要不是因Zen 2世代的EPYC吸引了不少超級電腦新案,像突破2ExaFlops的美國國家核能安全管理局的El Capitan等等,堂堂AMD在Top 500只佔有如此零頭的份額,怎麼說也說不過去。

硬科技:一窺NVIDIA「真正人工智慧」Volta的執行單元細節
硬科技:從地球模擬器到Summit:被GPU顛覆的超級電腦賽豬公

AMD將其定位為「Exascale」,當然不是區區1顆超級暴力的APU就可搞定(否則全世界所有超級電腦設計者大概都要跳樓了),而是眾志成城,預計在2022到2023年,用10萬顆EHP與20MW的耗電量,實現Peta等級的1000倍效能。

照片中提到了Exascale Node Architecture (ENA) board、Exascale、Heterogeneous,包含了結構化數據SQL、數據、非結構化數據、數據庫、大數據

按照AMD的公開論文,預期1顆EHP會有8顆32 CU(1個CU包含64個串流處理器)的GPU,總計256個CU與16384個串流處理器,當時脈為1GHz時,提供16TeraFlops的雙倍浮點精確度理論運算效能,10萬顆就是1.6ExaFlops。

照片中提到了GPU Chiplets、C、GGGG,包含了amd Chiplet Apu、AMD Vega、圖形處理單元、加速處理單元、Advanced Micro Devices公司

 

AMD也有藉由模擬手段,評估不同GPU組態(數量、時脈、記憶體頻寬)在執行多種應用程式時的能耗比,畢竟這會決定這台超級電腦的長期使用電費是否值得。以AMD的論文內容來說,他們認定32個CPU核心、320個時脈1GHz的GPU CU(20480個串流處理器)、3TB/s記憶體頻寬、160W功耗,是當時最適當的設定。

照片中提到了2.0、1.5、15,包含了情節、千瓦時、產品、產品設計、電腦電源輸出

照片中提到了Best App-Specific、Config.、(CUs / MHz / TB/s),包含了累計折舊、角度、線、折舊、字形

記憶體階層架構則是EHP另一個值得關注的重點,特別是斷電後資料不會消失的NVRAM(Non-Volatile  RAM)和「記憶體內運算」的PIM(Processing-In-Memory)。

照片中提到了FASTFORWARD 2 NODE ARCHITECTURE、AMDA、Node Architecture Design, Integration, and Evaluation,跟Advanced Micro Devices公司有關,包含了amd exascale阿普、萬億級計算、加速處理單元、的PlayStation 5

眼尖的科科一定會注意到:記憶體不限於封裝在APU的HBM,還有外部的DRAM、NVRAM(如Intel/Micro的3D Xpoint和發展中的SST-MRAM等)與內建位元運算電路的計算記憶體(Processing in Memory),該想到的幾乎都想到了。

照片中提到了Memory 100、TArray 110A、Bit Line,包含了畫畫、萬億級計算、電腦、/ m / 02csf、產品設計

計算記憶體專屬的快取資料一致性協定(Cache Coherence Protocol),也是AMD相關7份專利中的其中一篇。

照片中提到了104、STACKED、MEMORY,包含了畫畫、產品設計、畫畫、產品、/ m / 02csf

像EHP的動態記憶體管理和省電機能(看起來跟SmartShift頗有關連)也成為AMD的專利。

照片中提到了300、GPU 305、CPU 315,包含了畫畫、Advanced Micro Devices公司、中央處理器、圖形處理單元、電腦硬件

以前提到過3D封裝不易散熱的問題,AMD也提出了相關的專利設法解決,如塞入導熱層、佈置導熱用的假矽穿孔(Dummy Through-Silicon Vias)、熱電冷卻(Thermoelectric Cooling)與更完善的熱量管理機制等。

硬科技:談談Intel的多晶片水餃封裝技術

 

照片中提到了300、326 326、128,包含了圖、圖、技術圖紙、Advanced Micro Devices公司、電腦內存

言歸正傳,這看起來超像外星科技的EHP,AMD尚未公佈其產品化時程,但相關技術將提前應用在主流處理器的傳言(像Zen3世代EPYC「Milan」就傳聞不斷),卻從來沒有停止過。但無論如何,上看下看左看右看,AMD的EHP都比慘遭腰斬的Intel Xeon Phi來得實際可行多了。至於AMD要如何補強在軟體層面的大弱點,將是決定他們能不能追上nVidia的最重要關鍵。

硬科技:Intel邁向人工智慧晶片的一小步:Knights Mill

照片中提到了AMD LEADERSHIP PACKAGING、>10x、BANDWIDTH DENSITY,包含了禪宗禪3、禪宗3、Advanced Micro Devices公司、雷岑、py

最後,當年AMD併購ATI後過沒多久,某天筆者就做了個夢:AMD把超級多的CPU核心、更多的GPU和DRAM,一組組的疊在一起,還想到叫做「Impression」的奇怪代號。曾幾何時,筆者的黃粱一夢,卻可能成為Intel的天大惡夢,實在讓人始料未及。

反倒是靠著「未來性」而在近期市值超越Intel的nVidia,他們未來在超級電腦的布局,難道就沒思考過一個可能性嗎:在未來的高階GPU內,直接塞入高效能ARM或RISC-V指令集相容處理器,使其成為一個「主動的系統」,無須成為CPU的依附品?

搞不好這件事情已經是現在進行式,只是筆者不知、科科不曉,科科科科科。

6 則回應

  • 現在看到nvidia併購arm,看起來GPU裡塞入ARM不是不可能了
    2020-10-22
  • 大大的這個夢, intel的lakefield算是實現了嗎?
    2020-07-15
  • 取代NV的地位
    2020-07-15
  • 當桌機會不會更實惠
    2020-07-15
  • 把Vega 10拿來當chiplet用,面積是大了點,應該用Vega 20才對。

    甚至,AMD應該開發跟CPU Chiplet差不多大小的GPU Chiplet,然後依據客戶需求,組合成客製化APU才對。(面積一致組合的彈性才大)
    2020-07-14
    • CPU Die面積一樣大的GPU性能太爛,而現有CPU封裝的GPU性能又實際受限於記憶體頻寬,換上高頻率記憶體的桌面版Renoir顯示性能可以比筆電版漲50%就可以知道為什麼INTEL要搞edram
      2020-07-20