Arm 今年 Computex 的重點在於上週甫發表的三項高階新 IP ,分別是新一代的 CPU 微架構 Cortex-A76 ,新一代高階 GPU 微架構 Mali-G76 以及可支援 8K 的影像處理器微架構 Mali-V76 ,此三項高階架構不僅在性能上再度提升,更以未來趨勢強化機械學習性能,以及注入新一代 8K 、 AR/VR 多媒體體驗。
在正式介紹三項新架構前, Arm 副總裁 Nandan Nayampally 也將 Arm 去年一整年所發表的各項 IP 、技術等進行簡單的複習,同時重申 Arm 的 Project Trillium 是勢在必行的趨勢。
而此次公布的三大高階架構預計有望於 2019 年初導入市場新一代晶片,其中基於台積電 7FF 製程的 Cortex-A76 與 Cortex-A55 POP IP 預計在今年第四季開始提供。
為旗艦行動裝置與全時連網設備注入更強大性能的 Cortex-A76
Cortex-A76 是隸屬 Arm v8.2 指令集的新一代 CPU 架構,不僅鎖定智慧手機,更是為全時聯網裝置所規劃的高性能架構,旨在實現兼具節能的筆記型電腦級性能,同時在特性上也支援如 Arm DynamIQ 、 x86 模擬等功能,搭配 Cortex-A55 ,可彈性的規劃如 1+7 、 2+6 或者 4+4 等組合。
相較當前基於 10nm 製程、時脈達 2.8GHz 的 Cortex-A75 ,預計基於 7nm 製程、時脈可達 3GHz 的 Cortex-A76 的性能可提升 35% ,但同時能耗降低 40% ,且相較之下機械學習性能可提升 4 倍。
Cortex-A76 在架構上強化的部分包括四大主要項目:
1 、加入解耦合分支預測與指令預測,能使 Cortex-A76 的前端元件每個周期預估 4 到 8 個指令,同時利用多層式分支目標快取、混合間接預測器等維持最大處理量。
2、首度加入 4 解碼寬度核心,可使每周期處理指令最大數量增加,同時每周期達 8 個處理作業能分配到亂序執行核心,並支援更寬的空間與功耗最佳化指令窗口。
3、將具備 3 個簡單 ALU 與 1 個多週期整數處理元件的四指令管線整數處理單元直接內建於核心,同時雙指令管線原生式 16B ( 128bit )向量與浮點運算單元,藉此達到比 Cortex-A75 高出四倍的機器學習效能。
4 、除了快取階層針對延遲與頻寬進行協同最佳化以外, Cortex-A76 還配備精密的第四代預取器以及深度記憶體分層平行處理,使得記憶體系統相較前。式待進一步強化。
機器學習性能較前一世代強化 2.7 倍的 Mali-G76
Mali-G76 可說是為搭配 Cortex-A76 所誕生的新世代旗艦 GPU ,除了較 Mali-G76 提升 30% 效能密度、 30% 能源效率提升以外,亦在機器學習部分提升 2.7 倍性能,能滿足包括遊戲娛樂、 AR / VR 以及異構運算等需求,同時亦可支援包括 Direct X12 、 Vulkan 等新世代指令集。
Mali-G76 可說是延續今年初主流 GPU IP Mali-G52 的旗艦版,基於 Mali 第三世代的 Bifrost 架構,僅使用不到 Mali-G52 兩倍的矽面積卻具備兩倍的效能;同時為了滿足機器學習需求, Mali-G76 支援 Int8 dot ,藉以滿足當前主流機器學習框架的需求。
同時 Mali-G72 配雙材質貼圖對映器,處理量相較 Mali-G72 高出兩倍,能夠在高度耗電情境大幅節能,另外也改善暫存器,使用容量較大的庫存器庫區並減少一半數量,能使空間與能源效率改善。
為 8K 做好準備的 Mali-V76
8K 隨著東京奧運即將開跑,目前已經在許多先進國家開始進行試播,可預期不僅是智慧電視,手機也將跟上這股趨勢, Arm 最新的影像處理器 Mali-V76 就是為 8K UHD 與新一代 VR 與 AR 體驗所開發的產物。
Arm-V76 藉由加入額外的 AXI 匯流排提升一倍的處理量,並將影像管線的線緩衝區翻倍達到 8,192 個,並且預先搭載 8K 30fps 解碼功能,可提供 8K 所需的基本架構需求,同時也能夠作為如四路 4K 或是 16 路 FullHD 等彈性應用,諸如電視牆等亦可使用 Arm-V76 方案實現。
2 則回應