Intel在COMPUTEX 2024的重頭戲即是宣布隸屬第二世代Core Ultra處理器當中的Lunar Lake平台,Lunar Lake是Intel寄予厚望的能耗效率至上平台,自架構、晶粒布局等平台級設計著手,甚至取消招牌的超執行緒技術,希冀以x86架構於性能、續航力皆能雙雙打敗Arm架構PC處理器,同時NPU也獲得飛躍性的升級,達到48TOPS效能,符合微軟Copilot+ PC的要求,全平台異構總性能達120TOPS算力,滿足深度學習至生成式AI等AI應用需求。
▲Intel針對AI PC應用開發者將推出Lunar Lake DevKit套件
▲Lunar Lake DevKit如同一部NUC,前方帶有一顆可定義的AI鍵
▲後方的I/O配置
Lunar Lake平台預計在第三季量產,此外Intel也為了加速開發者進行AI應用開發,將推出Lunar Lake平台的開發套件Lunar Lake DevKit,並強調處理器具升級性。
本篇將概括性介紹Lunar Lake特色,另有一篇進一步針對Lunar Lkae的晶粒模組配置,以及採用的Skymount架構E-Core、Lione Cove架構P-Core、Xe2 GPU、NPU等架構與平台最佳化等進行說明的文章。
為輕薄高效能、長續航的進階產品型態規劃
Lunar Lake是進一步著重在能耗效能比的平台,專注在無外接GPU的裝置型態所設計,以追求長續航力、能耗效能平衡為平台規劃與設計目的,故屆時市場上的產品將為中高價位的輕薄筆電裝置,預期不會有平價機型推出。Lunar Lake在基本晶粒並未延續Meteor Lake的運算、SoC、GPU三Tile模組連接設計,而是專為節能重新規劃晶粒配置,更首度將Wi-Fi與藍牙整併至處理器內,還有透過在晶片載板直接安裝記憶體的方式,只為使能耗效率最大化。
▲Lunar Lake的Tile構成與Meteor Lake相當不同
▲從側面看Lunar Lake的立體堆疊
▲Lunar Lake的執行架構由運算Tile與平台控制兩大Tile構成
▲Lunar Lake各Tile之間透過高速通道相互溝通
▲記憶體直接與晶片封裝,提升傳輸效率與降低能耗
Lunar Lake將晶粒劃分為具備包括CPU、GPU、NPU等核心功能的運算Tile,負責能耗管理、I/O、無線網路的平台控制Tile兩大部分,另外還有濾波Tile以及底部的Base Tile,並透過Intel先進封裝技術、晶粒連接技術將不同Tile合併;同時晶片載板直接將節能、高效能的最高32GB LPDDR5x記憶體嵌合,相較傳統將記憶體顆粒安裝在PCB能大幅縮減傳輸路徑與主板占用,甫以每一晶片8.5GT/s頻寬、16bx4通道,能進一步提升40%的傳輸能耗效率。
著重於能耗效能的Skymount與Lion Cove架構與Thread Direct資源分配邏輯
▲Lunar Lake最多為4P+4E核心
▲Skymount具備媲美Raptor Lake的效能且能耗效率更勝Meteor Lake的LP E-Core
Lunar Lake採用新一代的Skymount架構與Lion Cove架構作為E-Core與P-Core,採用最多4P+4E的8核心配置,不再一味的衝高核心數量;Skymount是Intel E-Core的重大變革,除了能耗效率的提升以外,更注重能執行多數的日常應用程式,並在效能峰值與P Core的黃金交叉時交棒給P-Core,其效能直逼Raptor Lake的Raptor Cove,但能耗效率則更勝Meteor Lake的SoC Tile的LP E-Core。
▲Lion Cove取消HT技術,換取更好的日常使用能耗效能
代號Lion Cove的新P-Core進行大量的架構改革,不過最出乎意料的是Lion Cove於Lunar Lake取消可說是Intel招牌的HT超執行緒,主因是考慮日常使用情境與能耗效能;由於現代化的處理器已有相當多的CPU核心,使得實際會動用到超執行緒的情境並不多,根據Intel的說法,透過取消HT技術能使核心面積更為縮減,同時Lion Cove單執行緒任務較過往有更好的能耗效能比以外,多執行緒任務雖較具備HT小幅下滑15%,但在執行任務的能耗效率卻更出色。
▲Lunar Lake著重使P-Core與E-Core的性能能耗效能銜接接近線性,同時Skymount的性能也足以應用絕多數日常負載減少動用P-Core的情境
▲能耗效率是Lunar Lake優先考慮,付出的每W電力都要以最大的效益轉換為效能
由於核心配置方式的不同,以及核心效能的改善,Lunar Lake分配P Core與E Core運算的Thread Direct技術的邏輯也再度改變;不同於Raptor Lake的P-Core優先、Meteor Lake先SoC Tile後Compute Tile,Lunar Lake則是優先以Low Power Island的E Core優先執行任務,當任務負載高於E-Core算力或已非E-Core最佳轉換效率後移轉至P-Core。此外Lunar Lake由4路PMIC控制能耗,具備比以往更精細的時脈、電壓管理,將能耗管理最大化。
性能、光追、AI算力皆提升的Xe2 GPU
▲Xe2 GPU在基本性能、光追、AI、能源效率都獲得以倍為單位的提升
Lunar Lake搭配的GPU為Xe2 GPU,其基本架構基於全新的模組化設計架構,能因應不同運算規模擴展,而在Lunar Lake則配置最多8核GPU,並配有8個硬體光線追蹤加速器,同時針對AI具備XMX AI加速器與配置8MB快取,能夠實現達67TOPS的GPU效能,相較現行的Xe GPU提升一倍性能,或能以一半的能耗達到Xe的峰值效能。
▲解碼器新增VVC動態解析串流編碼的解碼能力,輸出入規格將螢幕顯示規格提升至更節能的eDP 1.5
Lunar Lake的Xe GPU所搭配的編、解碼引擎與影像處理器(DPU)也獲得升級,編解碼器除了支援AV1格式的編碼與解碼,還添加串流動態解析度技術最佳化的VVC解碼,觀賞支援VVC格式編碼的串流服務時能更快速、無縫的進行動態解析度調節,此外也支援基於AI的影像升頻;而圖像介面除了支援HDMI 2.1、DispalyPort 2.1以外,針對螢幕顯示採用支援主動幀率控制的eDP 1.5,搭配支援動態更新技術的高幀率面板時,能夠發揮節能與高更新率情境的優勢。
為滿足Copilot+ PC規範的NPU與著重全面性的異構AI運算
▲採用6核NPU,較前一代架構最大算力倍增外也具更優異的能耗效率
Intel強調Lunar Lake的設計並非只著重使NPU能符合微軟的Copilot+ PC規範,而是透過CPU+GPU+NPU異構運算實現現代化AI PC所具備的算力與運算架構,因為當前AI PC所需的運算無法由單一NPU囊擴,不同類型的AI運算對價購的需求不同,唯有因應不同的運算負載具備合宜的架構才是完整的AI PC平台。
▲Intel強調Lunar Lake的異構設計能滿足多元AI運算所需的架構需求,並具備不同領域的最佳化設計
Lunar Lake的NPU採用6核設計,配有12 SHAVE DSP、9MB的快取,並在架構設計進一步增強能耗效率,可發揮綜合48 TOPS的AI算力,符合微軟設置的40 TOPS的Copilot+ PC門檻;另外在CPU透過VNNI與AVX指令為AI運算加速,可達到5 TOPS算力;至於Xe2 GPU則具備XMX AI加速技術,達到67 TOPS的性能。
為輕薄行動設備型態所具備的介面
▲Lunar Lake的I/O配置為輕薄型態最佳化,PCIe Gen 5與PCIe Gen 4各4路、整合Wi-Fi 7與藍牙5.4、還有3路原生Thunderbolt 4
Lunar Lake的連接性也是因應產品設計型態提供最佳化設計,在不考慮連接高性能獨立GPU的前提,Lunar Lake提供4路PCIe Gen 5與4路PCIe Gen 4(可供連接兩條M.2 SSD),以及原生的3路Thunderbolt 4(相容USB4)、3個USB 3與3個USB 2介面,同時也首度將Wi-Fi與藍牙整合至處理器架構內,相較傳統透過USB或PCIe連接有更好的效能、低延遲,也實現更好的能耗管理。
Lunar Lake專注於中高階輕薄筆電型態需求,高效能將由Arrow Lake接棒
▲Lunar Lake鎖定的是中高階輕薄機型
▲Lunar Lake筆電原則上將以無獨顯輕薄機型為主
不同以往Intel會由單一架構負責超輕薄至中高效能平台,Lunar Lake可說是更極端的鎖定中高階輕薄筆電需求所設計的平台,其假想敵也相當顯而易見,為蘋果的M系列處理器與高通Snapdragon X系列平台,且由於平台具備高度完整性,還直接嵌合記憶體,意味著這款平台不太可能會被品牌用於低利潤的產品,屆時多會作為系統品牌的高階輕薄筆電平台。
▲Lunar Lake是Intel為能與Arm PC於能耗效能抗衡的平台,高效能平台將由Arrow Lake負責
至於高效能運算以及搭配獨立顯示的機型,預期屆時將會由代號Arrow Lake的平台交棒,不過畢竟此次Intel並未提及Arrow Lake,故還無法一探Arrow Lake與Lunar Lake的差異;但可預期的是做為將橫跨桌上型與高效能筆電的Arrow Lake不會如Lunar Lake將能耗效率放第一位其P Core與E Core的邏輯概念勢必不同,同時I/O的連接性勢必更為豐富,可預期未來Intel平台在針對能耗與效能的平台規劃將越來越為極端。