雖然x86處理器市場自從1998年底就確立了Intel和AMD兩家互毆的格局,但市場上並非沒有其他的玩家。除了源自於前蘇聯超級電腦研發團隊的俄羅斯Elbrus,在1999年9月16日,被VIA(威盛電子)從IDT收購的Centaur,也持續推出VIA Cyrix III、C3、C7、Nano等產品系列。
不過2011年的四核心Nano(VIA QuadCore)後,Centaur就幾乎毫無動靜。
相隔5年,在2019年11月18日,Centaur發表x86世界首款「內建人工智慧輔助處理器」的「伺服器系統單晶片」CHA,採用台積電16nm製程,原生八核心(CNS微架構),四通道DDR4-3200記憶體,可支援雙處理器組態,和連AMD Zen2世代都尚未具備的AVX-512指令集(完整度約為Intel那短命10nm製程Cannon Lake的水準,不及Ice Lake和Tiger Lake),預計2020年下半年投入量產。
Centaur CHA的晶片面積195 mm²,標準設計功耗不高於 85W。即使對Intel和AMD來說,這種數字根本是不值一提的小兒科,但對追求「簡單、迅速、便宜」的VIA處理器家族來說,算是驚天動地的破天荒創舉。
類似Intel 2011年Sandy Bridge至2014年Broadwell的作法,Centaur CHA內部主要功能單元,包含8個CNS核心(個別有2MB L3快取)、Ncore人工智慧推論輔助處理器、DDR4記憶體控制器、南橋與雙處理器連結介面,透過1個環狀(Ring)匯流排串接起來。
CNS核心微架構的規格和複雜度,相近Intel Haswell (2013年,22nm製程)的等級,沒有提供HyperThreading之類的同時多執行緒技術,也沒有微指令快取記憶體,應該也沒有把AMD Zen家族拉進來比較的必要了。
Centaur CHA最大的賣點,在於被戲稱為「AVX-32768」的超寬SIMD架構執行單元,藉由理論20TB/s的16MB SRAM確保穩定的傳輸頻寬。當執行推論常用的Int8短整數,理論效能為20.5T,低於Google初代TPU(92T)的四分之一。換成近年來在深度學習逐漸普及的bfloat16格式(BF16,指數小於FP32,精度下降而動態範圍不變),則僅剩Int8六分之一的效能。各位好學的科科可以自己去打探一下,現在NVIDIA和AMD的GPU是怎樣的性能。
至於這顆距離Nano睽違超過10年的Centaur CHA的前景,與VIA「進軍伺服器市場」的企圖,是否樂觀,筆者在此不做任何評論。但假如各位科科心裡有數,或著對VIA這間公司的歷史毫不陌生,恐怕已經科科笑到根本笑不出來了。CHA並非毫無利基,但也要天時地利人和樣樣具備才行。
2 則回應