硬科技:三星旗艦手機自主心臟M3核心微架構解析

2018.10.08 08:13PM
Samsung Galaxy S9, Exynos, Samsung Group, , System on a chip, Qualcomm Snapdragon, Central processing unit, , , Chipset, exynos 9810, text, product, product, font, brand, multimedia, Samsung

Apple為自家產品研發行動處理器,進一步涉足自主的處理器核心微架構和繪圖核心,身為Android手機出貨龍頭、並高度掌握關鍵性零組件的Samsung也不例外,早在2010年就採用自製的Exynos 3系列處理器,更在2016年初推出的Galaxy S7系列,其心臟Exynos 8890處理器的「大核心」導入了Mongoose 1 (M1) 核心微架構,接連在2017年的S8與2018年的S9陸續採用M2 (M1的10nm FinFET版本,類似Intel Tick-Tock的Tick)和全新設計的M3,而預定2019年問世的新處理器,幾乎篤定出現自主研製的繪圖核心,亦步亦趨的緊追著Apple。

Exynos, , Samsung Group, Samsung Galaxy S series, ARM Cortex-A76, Central processing unit, Presentation, Brand, Text, Architecture, Exynos, text, presentation, product, font, multimedia, angle, brand, product, screenshot

, , 癮科技, Samsung Group, Mobile Phones, Android, Smartphone, Product, Central processing unit, Multi-core processor, angle, text, font, line, area, black and white, angle, product, number

Samsung在今年的IEEE HotChips 30正式發表M3的技術全貌,配合兩年前同樣在HotChips揭露的M1,各位科科將慢慢了解這間韓國最大的消費電子產品及電子元件製造商,在設計行動處理器核心微架構的思維與弱點。

足以和Apple自主微架構媲美的「寬度」

以前筆者在舊文「為何Apple自產自銷的ARM處理器這麼厲害」時提及「Apple自主微架構實現了每時脈週期可擷取並解碼六個指令,遠勝過ARM自家核心甚至主流x86處理器」,比前代增加50%寬度的M3微架構讓Samsung與Apple平起平坐,而且達到了最高2.9GHz的運行時脈 (實際應用為2.7GHz)。

Hot Chips, Exynos, Central processing unit, Computer architecture, Integrated Circuits & Chips, , Samsung Group, ARM Cortex-A76, Processor, Samsung Galaxy, screenshot, text, software, screenshot, font, technology, number, angle, product, multimedia, computer program

ARM Cortex-A76, ARM architecture, Exynos, Samsung Group, , Hot Chips, Out-of-order execution, Instruction set architecture, ARM Cortex-A, Comparison of ARMv8-A cores, ARM Cortex-A76, text, technology, software, screenshot, font, multimedia, space bar, product, brand, electronics

前端變寬,後端非循序指令執行單元的擴張,像整數邏輯運算、暫存器重新命名排序緩衝器等,亦不遑多讓,這「跳躍」的幅度,乍看之下,還明顯超過Intel從Broadwell「Tock」到Skylake的程度。

ARM Cortex-A76, , ARM Cortex-A, Samsung Group, Exynos, ARM architecture, Microarchitecture, Central processing unit, Screenshot, Text, ARM Cortex-A76, text, font, area, line, presentation, sky, screenshot, angle, product, brand

似乎有點過度投資的浮點運算效能

但除了激增50%的IPC,同樣吃「寬度1.5倍威而剛」的還有浮點運算單元,吞吐量更高達M1/M2的2倍,這是M3微架構相較於前代更動幅度最大、也最讓筆者深感訝異的地方,當下最直覺的反應是:補償效能不佳的繪圖核心?如果火力全開拼命跑,手機的電池撐的住嗎?

ARM Cortex-A76, ARM architecture, Exynos, , Samsung Group, Out-of-order execution, Central processing unit, Instruction set architecture, System on a chip, ARM Cortex-A, ARM Cortex-A76, text, software, technology, screenshot, font, multimedia, brand, product

「桌機化」的快取記憶體與載入儲存單元

雖說高效能處理器微架構也就那些萬流歸宗、殊途同歸的「招數」,但即使將M3的名稱改成過去的高效能x86處理器,恐怕也不會有太多違和感。為了餵飽嗷嗷待哺的龐大運算單元,M3的快取記憶體子系統長的這麼像桌機處理器,從所有核心共享第二階快取,演進到每個核心獨享專屬第二階、再共享第三階,也不太讓人感到訝異就是了。Qualcomm Snapdragon 835到845也是走過同樣的發展軌跡。

但眼尖的科科絕對可以察覺到一個驚人的地方:M3的第二階快取記憶體和第三階快取記憶體,容量竟然高達同期競爭對手Qualcomm Snapdragon 845的「2倍」。這算不算「過度投資」呢?或著Samsung其實對M3的未來應用另有打算呢?這就留待時間來回答了。

, Samsung Group, Computer program, ARM Cortex-A76, Exynos, Mobile Phones, Presentation, Multimedia, Clamshell design, Screenshot, screenshot, text, software, screenshot, presentation, multimedia, font, technology, computer program, brand, media

ARM Cortex-A76, ARM Cortex-A, ARM architecture, Exynos, Text, Brand, Presentation, Samsung Group, , Software architecture, ARM Cortex-A76, text, product, font, product, brand, number, presentation

Hot Chips, Exynos, Central processing unit, , Samsung Group, Computer architecture, Processor design, ARM Cortex-A76, Computer, Processor, copenhagen central station, text, technology, games, software, structure, pattern, screenshot, line, area, font

無可避免的加深指令管線

天底下沒有白吃的午餐,執行單元爆增又要維持高時脈,「切割」部分電路延遲特長的管線階段、加長指令管線深度是免不了的必要之惡,為了指令分派與存取實體暫存器,M3的指令管線深度從前代的13階增加到15階。

ARM Cortex-A76, ARM architecture, Exynos, ARM Cortex-A, Out-of-order execution, Central processing unit, , Samsung Group, Instruction set architecture, ARM Cortex-A75, ARM Cortex-A76, text, software, font, screenshot, line, multimedia, angle, brand, number, computer wallpaper

Instruction pipelining, Processor, Exynos, Processor register, Instruction, , Out-of-order execution, ARM architecture, Pipeline, x86, Hot Chips, text, software, font, screenshot, line, multimedia, number, display device, angle, brand

更深的管線也意味著更大的分支預測錯誤代價,Samsung也必須在這裡下點功夫,改良後的分支預測機制可將MPKI (每一千條指令中發生預測錯誤的次數) 降低15%,彌補管線加深後的損失。

ARM Cortex-A76, , ARM Cortex-A, Exynos, ARM architecture, Central processing unit, Samsung Group, Mobile Phones, Software architecture, Text, ARM Cortex-A76, text, line, technology, font, multimedia, presentation, angle, screenshot, brand

近似桌機處理器的高效能單執行緒

設計概念越看越像桌機處理器的M3,其設計思維,從Samsung只在Hotchips 30公開GeekBench 4的單執行緒效能數據,即可略見一斑。事實上,Exynos 9810的確在單核心表現上,已經很接近Apple A10,也明顯勝於Qualcomm S845。但問題來了,這真的完全符合行動式裝置的需求嗎?

, ARM Cortex-A76, Exynos, Samsung Group, ARM Cortex-A, ARM architecture, Font, Angle, OpenGL, Aztec Ruins National Monument, ARM Cortex-A76, text, line, font, area, angle, sky, screenshot

ARM Cortex-A76, , ARM Cortex-A, Exynos, ARM architecture, Samsung Group, Technology, OpenGL, Font, Angle, ARM Cortex-A76, text, line, technology, font, area, angle

可是,瑞凡,我還是比較想要Snapdragon 845的Galaxy S9 Plus…

Line, Angle, Font, Product, Black, angle, text, font, line, area, black and white, angle, product

自從Samsung腳踏兩條船、同時使用自家Exynos與Qualcomm Snapdragon,不同處理器版本手機的效能耗電差異,就一直是頗具爭議性的話題。以Galaxy S9這個世代來說,經過大量實證,Snapdragon 845整體優於「頭重腳輕、桌機等級的大核心拖著小核心和註定輸人的GPU」Exynos 9810,尤其是繪圖及多執行緒效能,可以說是網路輿論的共識了。筆者身為Galaxy S9 Plus使用者,當然也希望自己手上的手機也是Qualcomm Snapdragon 845版本。

但Samsung在自主研發晶片所付出的努力仍然值得肯定,特別在HotChips 30的簡報中,開宗明義的說出最大的挑戰:產品開發時程須跟的上智慧型手機頻繁的推出頻率。筆者依舊期待Exynos完全追上Snapdragon並勝出的那天,畢竟,在台灣也只有Exynos版本可買啊...

2 則回應

  • 我只知道有個叫獵戶座的處理晶片玩遊戲根本慘不忍睹,自研是很值得鼓勵,但是軟體方面的調校只能等google肯不肯大刀闊斧的處理碎片化的情形
    2018-10-09
  • 感謝小編寫這篇文章!
    不然有果粉又要說「蘋果都是全部自己開發的,所以貴得值得」
    說得好像安卓機的 CPU 都是撿 ARM 現成的,都是免開發費用的…😆
    2018-10-09