Arm 宣布基於 Armv9 指令級三款 CPU 微架構,包括 Cortex-X2 性能核心、 Cortex-A710 大核與 Cortex-A510 小核

2021.05.25 10:31PM

Arm 在今年 3 月的 Vision Day 宣布全新的 Armv9 指令集後,已經公布資料中心級的 Neorvese N2 將採用此全新指令集,而在 Computex 前夕, Arm 也公布全新系列的 IP 組合,其中包括三款採用 Armv9 指令集的 CPU 微架構,包括性能核心 Cortex-X2 ,"大核" Cortex-A710 與四年來首度改版的"小核" Cortex-A510 ,而這三項核心亦可透過 DynamIQ 建構大小核,但除此之外針對運算級應用, Arm 還公布 DynamIQ 共享單元 DSU-110 ,可構成單一 Cluster 達 8 個 Cortex-X2 ,自穿戴設備、手機、數位電視到 PC 級應用提供最大化效能。

另外, Arm 也藉此宣布自 2023 年後,所有的行動運算的大核心與小核心將全面 64 位元化,屆時 Arm 將不再提供 32 位元 Cortex-A 核心的 CPU 微架構。

Arm CPU 微架構重新定位三大產品線

▲ Armv9 的微架構將分為 Cortex-X 、 Cortex-A700 與 Cortex-A500 三大系列

在 Cortex 系列邁入 Armv9 架構, Arm 也將旗下的 CPU 微架構產品定位進行再調整,未來 Cortex-X 除了半客製化架構的身分,也兼具追求最高效能的超高效能核心;至於大核心 Cortex-A700 則重新定位於適合多核工作負載與能耗效率平衡,具備最佳持續性能的性能核心;小核 Cortex-A500 則繼續最佳能源效率應用,作為輔助大核 Cortex-A700 系列、性能核 Cortex-X 構成大小核設計,為處理瑣碎的背景與輕度負載作業而生。

追求最高效能與 PC 級運算性能的 Cortex-X2

▲ Cortex-X2 較現行 Cortex-X1 提升 30% 性能

Cortex-X2 是 Arm 第二世代的 Cortex-X 半客製化 CPU 微架構,在定位上是作為高階手機架構中處理高度複雜運算的瞬間高負載,或是做為 PC 型態產品的高效能運算核心; Cortex-X2 強調相較上一世代大幅改善 IPC ,比起當前 Cortex-X1 的單核心效能提升 30% ,並相較 2020 年基於 Arm 架構之 Windows 10 筆電與 Chromebook 高出 40% 單執行緒性能。

Arm 視 Cortex-X2 能夠為追求效能的筆記型電腦帶來更大幅度的效能提升,並藉由 DSU-110 的特質,可為追求效能的 Arm 架構 PC 處理器帶來單一 Cluster 達 8 核心的 Cortex-X2 設計,並具備最大 16MB 的 L3 快取,使筆記型電腦用的 SoC 能夠具備更彈性的設計。

追求持續效能與效率最大化的新世代大核 Cortex-A710

▲ Cortex-A710 著重在能源效率與持續性能

既然當前高效能核心的定位已經被 Cortex-X2 取代, Cortex-A710 就不再象徵追求最高性能的定位,但仍舊是 Arm CPU 微架構中的要角,在全新的產品定位做為負責主要主流級運算的性能核心,並強調針對持續高度工作負載具備最佳化的效率,同樣可涵蓋自高階智慧手機、筆電、智慧家居與智慧電視等類型的需求。

Cortex-A710 相較最高性能的 Cortex-X2 更著重性能平衡、能耗與晶圓面積,相對 Cortex-A78 在相同的功耗約提升 10% 的性能,然而在能源效率卻大舉提升 30% ,意味著在相同的日常使用情境可望延長設備的續航力,同時因應主流的機器學習也提升 2 倍的性能。

四年來首度改版的小核 Cortex-A510

▲ Cortex-A510 相較 Cortex-A55 進步幅度相當顯著

相較於上一世代"大核" Cortex-A7x 系列微架構幾乎每年一度的改版,"小核" Cortex-A55 已經是 2017 年在 Computex 所公布的微架構,而此次大改版到 Cortex-A510 也有顯著的整體提升,在性能方面對比 Cortex-A55 提高 35% ,而在能源效率也提升 20% ,同時增加達 3 倍的機器學習性能。

同時 Cortex-A510 還具備一全新的創新技術,稱為合併核心微架構( merged core microarchitecture ),合併核心微架構能夠將 2 個 Cortex-A510 構成一個群組,單一個 CPU 可由多個群組構成,利用此彈性化的的結構設計能進一步提升單位面積效率與擴充彈性,簡單來說就是類似當前 AMD 的 CPU 是透過多個 CPU CCX 模組構成一顆大型 CPU 一樣。

雖然 Cortex-A510 定位在處理背景與輕度負載內容,但性能大幅提升之下,也等同具備 Cortex-A510 的處理器能夠在更多的應用僅需使用省電的 Cortex-A510 ,減少動用到 Cortex-A710 與 Cortex-X2 的時間,進一步提升整體效能;同時對於主要以 Cortex-A510 構成的中低階處理器也能具備更出色的性能但兼顧能源效率。

開創 DynamIQ 更多可能性的 DSU-110

照片中提到了The DSU-110 is the Backbone of the Armv9 CPU Cluster、Uncompromised performance and efficiency、LAPTOP,包含了三角形、產品設計、牌、三角形、產品

▲ DSU-110 能在單一 Cluster 容納最多 8 個 Cortex-X2

在當前 Armv8 指令集時代所宣布的 DynamIQ 中,單一個 Cluster 可容納最多 8 核心、包括 4 個大核與 4 個小核;而 Armv9 所搭配的 DSU-110 雖在單一 Cluster 仍為 8 核心,不過卻可容納最多 8 個 Cortex-X2 高性能核心,這也意味著除了原本的行動運算級與入門筆電外, Armv9 為 Arm 架構進一步帶來跨足高效能 PC 領域的可能性。

從能源效率的角度,基於 DSU-110 的 DynamIQ 設計可自 4 個 Cortex-A510 、 2+6 大小核、 4+4 大小核到目前高階手機處理器的 1 + 3 + 4 組合外,針對更進階的主流效能筆電能提供 4 個 Cortex-X2 搭配 Cortex-A710 的組合,若將情境轉換到桌上型 PC 設備,甚至可藉由 8 核 Cortex-X2 搭配主動散熱帶來更驚人的性能。

DSU-110 使核心之間的頻寬提升達 5 倍,同時也進一步改善能耗與降低多核協作的延遲,並提供高效能運算配置最高 16MB 的 L3 ;另外在能源管理部分, DSU-110 減少 CPU Cluster 的能源耗損,同時在部分核心停止供電時仍可進行低強度的工作負載,此外搭配全新的 PPC 整合電源策略單元與多種省電模式提供更好的能源管理。

藉 Armv9 指令集大幅提升的機器學習性能

照片中提到了CPU ML Performance: Growing Leaps & Bounds、CPUS are the default ML Processor in many systems – simplest and easiest porting target、ML Performance (relative to Cortex-A55),包含了介紹、介紹、圖、產品、牌

▲ Armv9 指令集進一步提高機器學習的性能

機器學習已是目前自行動裝置到 PC 都相當主流的技術,藉由導入 Armv9 指令集,此次宣布的 Cortex-X2 、Cortex-A710 與 Cortex-A510 可支援 BFloat 16 格式,矩陣運算能夠支援 Int8 、 BF16 與 SVE2 ,使得新世代的架構皆較前一代在機器學習有明顯的提升,尤以 Cortex-A510 更比起 Cortex-A55 在機器學習提高 3 倍性能。

安全性始終是重要的

照片中提到了Security Evolution、with Armv9 CPUS、Detection and prevention,包含了圖、產品設計、牌、產品、儀表

▲強調新世代架構具備更升級的安全保護

當然安全性也持續是 Arm 所重視的,除了承襲既有的安全技術外, Armv9 指令集也針對需求導入一系列全新的安全功能,例如 Secure-EL2 可針對受信任的服務提供標準化的安全隔離機制,記憶體標記擴展 MTE 則可避免記憶體遭受竄改,同時 Arm 亦與 Google 合作,針對 Android 導入 MTE 技術,進一步強化 Android 的安全性。另外 Armv9 也在 NEON 與 SVE2 添加加密指令,以及透過整合的硬體架構防護避免側通道攻擊。

AVE2 將為消費級應用帶來更好的機器學習與機器視覺強化

照片中提到了SVE2: Write Once, Optimize Once, Deploy Forever、Easier for developers、Higher performance apps,跟AccuWeather有關,包含了介紹、多媒體、介紹、產品、牌

▲ Arm 強調 SVE2 將相當容易導入

雖然 SVE2 原為超算系統的 SVE 指令級延伸而來,不過由於對機器學習與機器視覺可帶來相當大的幫助, Arm 也在消費級的 Armv9 指令級的 CPU 架構中導入 SVE2 ,同時強調 Arm 著手簡化對消費設備導入 SVE2 支援的流程,開發者可透過簡單的代碼使應用支援 SVE2 。

Armv9 指令集 CPU 進一步拓展 Arm 架構在行動運算的可能性

照片中提到了Armv9 CPU Cluster: A Step Change in Premium Mobile、Armv9 CPU cluster、o Performance,包含了多媒體、屏幕截圖、顯示裝置、計算機程序、多媒體

▲性能的提升、架構配置的彈性皆使基於新一代 Arm CPU 的消費級產品有更出色的表現與設計彈性

藉由導入新一代 Armv9 指令集,除了基礎性能的提升以外,也使 Arm 在消費級產品的架構設計具備更多元的變化,並進一步自輕薄型 PC 產品邁入高效能 PC 產品領域,但同時也兼具能源效率與更進化的機器學習性能。