硬科技:幻之處理器系列 DEC Alpha 21464(2003年)

2023.01.20 03:16PM
照片中提到了a Alpha Microprocessor Overview、Higher Performance、0.18μm,跟捷克電視有關,包含了大氣層、中央處理器、數碼設備公司、精簡指令集計算機、科穆特·庫梅西

時代背景:在1998年1月26日,陷入財務危機的DEC被Compaq以96億美元收購,1999年的Compaq財務危機亦嚴重影響到Alpha處理器的開發與伺服器的生產,讓Alpha的未來蒙上了一層厚厚的陰影。在2001年6月25日,Compaq以「預定在2004年都被Intel Itanium取代」為由,宣佈停止Alpha 21464 (EV8) 的發展,HP在2001年9月4日宣佈以225億美元併購Compaq,更加速了Alpha消失的進程。但這些商業層面的決策,卻絲毫不影響Alpha對於後世的巨大影響,包括Alpha 21464那驚世駭俗的 “SMT4”。

「即使消失,但依舊流芳百世」堪稱是對DEC Alpha最佳的註腳。昔日的RISC諸神之首與絕對的效能王者,對高效能處理器的發展,影響至為深遠,而且AMD還是最具有Alpha「基因」的廠商,沒有之一。

硬科技:RISC諸神的黃昏系列 DEC的Alpha (上)

硬科技:RISC諸神的黃昏系列 DEC的Alpha (中)

硬科技:RISC諸神的黃昏系列 DEC的Alpha (下)

硬科技:AMD同時多執行緒SMT4是什麼?圖解CPU各種核心與執行緒關係

在1999年的微處理器論壇 (Microprocessor Forum),Compaq陸續公開了Alpha 21464的技術細節,概要如下:

  • 第五世代Alpha處理器,代號 “Araña (西班牙文的「蜘蛛」)”。

  • 預定2003年上市,所以對手將是可怕的IBM Power5 “Squadron (戰鬥部隊)”。

  • 全新的核心微架構 (Alpha 21364沿用Alpha 21464)。

  • 8指令發出、4同時多執行緒 (SMT4)、非循序指令執行,實體暫存器多達512個。值得注意的是,同樣擁有SMT4的IBM Power7,已經是2010年了。

  • 來自8個指令的運算工作可內部派發到8個整數運算單元和4個浮點運算單元,這意味著執行單元規模將是前代的兩倍。

  • 從分支預測錯誤的代價推測指令管線深度約為14階,預計時脈1.2GHz到2GHz。

  • L1資料快取64kB,L2快取3MB。

  • 0.13µm製程,SOI晶圓,銅導線。(看來很像是準備給IBM或AMD代工)

  • 晶粒面積420平方公釐。

  • 2億5千萬電晶體,這是Intel 90nm (0.09µm) 製程Pentium 4 Prescott的兩倍整。

  • 整合「10通道」Direct Rambus記憶體控制器與近似Alpha 21364的系統匯流排,可延展到512個處理器。。

  • EV8後繼將有追加50個向量指令 (32個64 x 128位元暫存器,這實在無法讓人不聯想到Intel在Sapphire Rapids的AMX,但相隔卻超過二十年) 的延伸架構 “Tarantula (狼蛛)” 與時脈高達4GHz的雙核心版本。

無論上看下看左看右看,Alpha 21464根本就是個不折不扣的效能妖怪,其研發團隊選擇另一條和當時IBM與Intel截然不同的路線:加倍執行單元,然後盡其所能的去塞最多的執行緒。根據Compaq公佈的評估數據,在SPEC CPU 95的部份項目,四執行緒可達到單執行緒的兩倍效能。

照片中提到了a Decomposed SPEC95 Applications、250%、200%,跟康柏、捷克電視有關,包含了大氣層、圖形、多媒體、介紹、字形

各位科科要先想起一件事:在那時候,根本就沒多少人知道「處理器微架構引進多執行緒」這件事,但事實上,DEC早在1995年就開始進行相關的研究了,遙遙領先其他競爭對手。當代兩位RISC大師David Patteron和John Hennessy的計算機結構計量方法,第二版是1996年,2003年的第三版才探討同時多執行緒導入於多指令派發處理器後可帶來的高度效益。

我們回到1999年的命案現場,Compaq畫出以下圖解,解釋四條同時多執行緒徹底壓榨指令管線所有功能單元的樣貌。但筆者一直覺得這張圖缺乏「倍增執行單元」的感覺。

照片中提到了a SMT Pipeline、Fetch、Decode/ Queue,跟康柏、俄亥俄州立大學有關,包含了大氣層、超級電腦、ASCI Q、電腦、中央處理器

也因此,筆者在十年前自己重畫了這張圖,這樣應該比較有倍增執行單元的Fu。

 

 

照片中提到了SMT Pipeline (4 Thread, Double Execution)、Fetch、Decode,包含了大氣層、中央處理器、英特爾、PDP-11、Advanced Micro Devices公司

前面有提到AMD是最被Alpha「洗腦」的公司,他們失敗的推土機 (Bulldozer) 微架構K11,那個「叢集式多執行緒  (CMT,Cluster-based Multi-Threading)」,也是可以說是「電晶體預算毫無任何浪費、通通砸到刀口上的窮人版Alpha 21464整數運算核心」。為何筆者會這樣講? 看了下面這張圖 (也是花了不少時間),再想想整合GPU的Fusion大戰略,相信各位科科都不難理解這高度的相似性。

硬科技:簡報王與他們的產地:AMD Fusion篇

照片中提到了Cluster MT Pipeline with Shared FPU (Bulldozer)、Fetch、Decode,包含了大氣層、中央處理器、數碼設備公司、電腦、英特爾

最後,我們有充分的理由相信,連Intel內部都承認「比我們手上擁有過的任何東 (當然包括Itanium) 西都來得更好」而且還一度成為最有希望取代x86的RISC的Alpha,被平白放棄真的是一大歷史錯誤。如果有「計算機之神」的存在的話,祂也希望看到Alpha 21464跟IBM Power5正面對決的那一刻吧,如假包換的「五代機大對決」耶。糟糕,筆者好像被發現是軍武迷啦!

回顧消失在歷史洪流的Intel旗艦處理器Itanium(上)

回顧消失在歷史洪流的Intel旗艦處理器Itanium(中)

回顧消失在歷史洪流的Intel旗艦處理器Itanium(下)

硬科技:歷史上著名的逆轉秀IBM Power5