微軟在公布 Xbox Series X 遊戲機時就已經公布全新的 DirectStorage API 技術,該項技術簡化遊戲內容加載的材質解壓縮過程,由以往先把硬碟資料傳送到 CPU 解壓縮後再傳輸至 GPU ,改成 GPU 直接讀取硬碟內的資料並以更多核心的 GPU 處理解壓縮,藉此釋放 CPU 效能並提升遊戲加載速度;近期微軟除了提供 DirectStorage API 的測試程式外,由 Square Enix 發行的 Forspoken 也成為第一款支援 DirectStorage API 的遊戲;當然也由於 DirectStorage API 測試軟體上線,外國媒體也進行搭配 PCIe Gen 3 、 PCIe Gen 4 與 PCIe Gen 5 等 SSD 的實測,但結果卻有些出乎意料。
外媒 Compusemble 使用威剛的 ADATA XPG SX8200 Pro ( SM2262 主控 )作為 PCIe Gen 3 的代表, PCIe Gen 4 則選擇 Samsung 990 Pro ,而 PCIe Gen 5 則使用群聯 Phison E26 公版(反正後續就會有不少貼牌產品...)進行比較,結果進行遊戲加載測試, PCIe Gen 3 的 SX 8200 Pro 需時近 14 秒,而 Gen 4 的 990 Pro 約需 11 秒, Gen 5 的 E26 則縮減至 10.5 秒左右。雖然從數字還是有三秒的落差,但單純從多數消費者的體驗, 13 秒與 10.5 秒恐怕不會覺得有太多體感差異。
▲傳統的材質解壓縮流程須先把資料傳送到 CPU 一側的系統解壓縮後再傳入 GPU 的子系統
DirectStorage API 的技術關鍵在於高速的儲存產品與高速 PCIe 通道,故 DirectStorage API 在使用 SSD 與高速 PCIe 通道才能發揮最大效益,不過以當前的環境,雖然在通道與儲存裝置已經達到 PCIe Gen 5 ,但目前還未有 PCIe Gen 5 的 GPU ,使得傳輸頻寬仍受限於 PCIe Gen 4 的極限,加上第一世代的 PCIe Gen 5 SSD 的讀取僅約 10,000B/s ,也沒有相較頂規 PCIe Gen 4 的 7,000MB/s 有壓倒性的落差,目前 PCIe Gen 5 在 DirectStorage 的效益微乎其微。
▲ NVIDIA 的 RTX IO 在原理特質即是活用 DirectStorage
從 DirectStorage API 的原理來說,材質解壓縮的行為主要是依賴核心數量進行處理,故相較 CPU 而言, GPU 擁有更多的核心能夠處理材質解壓縮,能夠大幅提升材質解壓縮效率,其次是藉由 GPU 直接讀取壓縮材質,也將原本繁瑣的先傳到 CPU 解壓縮後再傳送到 GPU 的流程變得更簡單,畢竟這些壓縮材質最終也是要存放在 GPU 的;故 DirectStorage API 的價值在於降低 CPU 額外的負擔,並使遊戲加載更迅速。
▲ AMD 的 SmartAccess Storage 也是符合 DirectStorage 規範的技術
然而由於材質解壓縮的行為不光只是在遊戲過場階段,在大型遊戲的遊玩流程當中也會持續進行,例如玩家玩現代化遊戲偶而會在遊戲過程聽到原本安靜的 CPU 風扇開始運轉,即是 CPU 在處理遊戲所需的材質解壓縮;但現在等於把原本由 CPU 的工作負載改由 GPU 處理,意味著 GPU 除了處理遊戲圖形外也需挪出部分的資源處理材質解壓縮,若是在 GPU 負載較大的特效全開 AAA 遊戲,勢必會影響到一部分幀率,不過仍可換來加載速度更為即時的優點。
▲由於傳輸的流程簡化,同樣搭配 Gen 4 SSD 能夠相較 CPU 解壓縮顯著提升加載的效率
不過筆者認為, DirectStorage API 對於搭配高階多核 CPU 的使用者效益不如搭配中階 CPU 來的顯著,畢竟如 Intel 當前的 i9 已經達到綜合 24 核心、 AMD Ryzen 9 也達到 16 核心,原本在處理材質解壓縮的速度就較為顯著,但若是以中階 CPU 搭配高階 GPU 的組合則更能發揮 GPU 的效能優勢,這也是遊戲機會比起 PC 系統更快導入 DirectStorage API 的原因。
2 則回應