科技應用 nvidia 微軟 DGX A100 MT-NLG 微軟與 NVIDIA 合作建造全球最大單一規模語言模型 MT-NLG 能以簡單問句構思完整解答 透過NVIDIA DGX SuperPOD建構的Selene超級電腦,背後總計以560組DGX A100進行運算,透過NVLink、NVSwitch串接每台DGX A100所搭載80GB記憶體,藉此對應龐大自然語言模型運作時所需巨量資料,並且透過分散式訓練讓系統以更高效率完成學習。 微軟攜手NVIDIA打造全球最大單一規模的變形金剛 (Transformer)語言模型MT-NLG (Megatron Turing Natural Language Generation Model),標榜具備5300億組參數,成為Turing NLG後繼語言模型,更是目前普遍使用、具備1750億組參數的GPT- Mash Yang 3 年前