NVIDIA在CES 2025年公布GeForce RTX 50系列時,強調首發四款產品當中售價549美金的GeForce RTX 5070能夠有著媲美1,599美金的GeForce RTX 4090的遊戲效能,當下台下歡聲雷動,不過隨著NVIDIA官網釋出完整的硬體規格,很快就有玩家質疑為何僅668個CUDA Core、記憶體更僅有12GB且頻寬僅6成的RTX 5070能夠越級打怪,答案就是全新的DLSS 4遊戲影像增強技術,其中扮演關鍵的是專屬於GeForce RTX 50的多幀生成(Multi Frame Generation)。
▲已有75款遊戲與應用將在Day 0支援DLSS 4
▲玩家屆時更新驅動與NVIDIA App即可獲得DLSS 4加持
NVIDIA預計在GeForce RTX 50開賣的同時,就會有超過75款遊戲支援DLSS 4與多幀生成,玩家屆時僅需更新驅動程式與NVIDIA App,即可啟用DLSS 4的新技術與新版DLSS模型。
▲既有的顯示卡仍可因為DLSS 4在畫質獲得改善
NVIDIA在Ada Lovelace架構的GeForce RTX 40系列所支援的DLSS 3技術導入Frame Generation幀生成(FG)技術,不同於傳統補幀技術是在幀與幀之間插入黑幀營造更流暢的錯覺,幀生成結合來自遊戲引擎的場景數據與AI預測,藉由前後幀的關聯性於中間補入一幀,相較傳統捕幀會有不連貫感,幀生成則由於加入帶有實際影像的一幀更貼近原生高幀。
不過有趣的是在遊戲中玩家並不會看到DLSS 3的選項,而是透過啟用DLSS(或DLSS 2)搭配幀生成,根據NVIDIA的說法,幀生成是DLSS 3選擇性功能,但採用通用AI模型的DLSS 2所支援的各項功能也仍舊持續進化,故NVIDIA在後續的敘述都會傾向稱為DLSS,不會強調DLSS的世代。
▲DLSS 4的多幀生成可在幀與幀之間插入AI生成的3幀
NVIDIA在Blackwell世代的GeForce RTX 50所支援的完整DLSS 4包括全新的Multi Frame Generation多幀生成技術(MFG),相較DLSS 3的幀生成僅在幀與幀之間插入一幀,DLSS 4的多幀生成以相同的參考資料一口氣產生三幀,使得幀率一口氣擴展4倍,換言之倘若GeForce RTX 5070原生幀率僅有GeForce RTX 4090的一半,但在支援DLSS 4的多幀生成對比僅支援DLSS 3幀生成的GeForce RTX 4090卻能夠打平,藉由DLSS 4與多幀生成,平均一個圖像當中的16個像素有15個是由AI產生。
▲新的幀生成模型不僅速度更快,亦可減少記憶體占用
而且DLSS 4還帶來舒緩VRAM容量的好處,全新的幀生成AI模型提高了40%的速度,還減少30%的VRAM使用,NVIDIA以戰槌40K:黑潮為例,能夠提升10%的幀生成時間,並在4K解析度減少400MB的VRAM使用;筆者認為對玩家比較直接的影響是縮減幀生成的時間,因為這代表能夠以更低的延遲進行最終輸出,進而使遊戲體驗更流暢。另一個值得注意的多幀生成的AI模型還透過AI模型取代原本使用硬體光流進行光流場生成,減少硬體額外運算的資源。
▲結合多幀生成的DLSS 4產生的圖像平均16畫素中有15個畫素是AI產生
接下來勢必有玩家會質疑為什麼僅差一個世代,Blackwell可支援DLSS 4的多幀生成,但Ada Lovelace僅支援DLSS 3的幀生成,由於筆者並未前往CES無緣詢問NVIDIA專家,然而從2024年參與GTC 2024的Blackwell發表會,在架構說明時,Blackwell架構所搭載的第二代Transformer引擎可支援FP4與FP6浮點運算,筆者查詢了一下Ada Lovelace則僅支援到FP8,這也意味著GeForce RTX 50可透過更低精度的方式以更高效能執行AI應用,尤其對基於圖像生成的幀生成更為有利。
▲DLSS 4將底層的CNN模型提升至Transformer模型
▲DLSS 4結合Transformer模型能進一步提供更穩定、高品質且無暇的畫質
不過對於既有的GeForce RTX顯示卡用戶,DLSS 4技術也帶來包括DLSS光線重建、DLSS超解析與DLAA等三大基礎功能的革新,其中最重要的是導入Transformer模型技術;DLSS技術是基於CNN捲積神經網路作為基礎,在公布的6年以來NVIDIA團隊認為已經達到CNN的技術上限,故NVIDIA科學家決定採用新方式進一步提升DLSS的效能。
▲扣除多幀生成,DLSS 4的模型更新仍可使既有的RTX顯示卡獲得畫質與效率提升
NVIDIA使用的全新DLSS Transformer模型積於視覺Transformer,並透過高於CNN模型兩倍的參數藉此更深入的理解場景,使產生的影像更穩定、疊影更少、移動影像的細節更清晰,場景邊緣更為平滑;除了也進一步改善超解析技術的畫質,尤其在密集光線追蹤內容,透過Transformer技術相較傳統CNN模型能更精確且更無瑕疵的進行增強。
▲由於Far Cry 6僅啟用光線追蹤,應該是相對其它啟用增強技術的遊戲更具參考價值的對照組
至於GeForce RTX 5070的真實效能大概是哪個水準?NVIDIA官網也提供一份相對效能的參考,是基於2,560x1,440解析度的最高特效設定,其中Far Cry 6恰好只有啟用光線追蹤,以GeForce RTX 4070為對照組,大概會多個30%以上的性能吧。