GTC 2022 : NVIDIA AI 宣布在語音、推薦系統與大規模推論多項進展與升級工具

2022.03.23 01:30AM
照片中提到了Major Updates to NVIDIA AI、Speech、Recommender Systems,包含了屏幕截圖、產品設計、設計、文本、德國

NVIDIA 已多次重申 NVIDIA 是軟體與硬體相輔相成的公司,尤其在以 GPU 加速為基礎的 AI 技術驅動 AI 產業發展, NVIDIA 屢屢推出針對不同領域的 AI 工具,以及持續改善工具使效率更為提升,在今年 GTC 大會, NVIDIA 也宣布其 AI 技術在語音、推薦系統與超大規模推論的重大進展,此次 NVIDIA 在 GTC 大會宣布更新達 60 款 SDK ,使其具備更高的效率,並首度針對作業研究、量子演算、 6G 研究與圖形分析科學家提供全新工具。

NVIDIA 在此次 GTC 大會宣布啟動 NVIDIA AI 加速計畫,能確保由 NVIDIA 軟體與解決方案合作夥伴開發的 AI 應用程式的效能與可靠性,並且使這些經過驗證的 AI 加速應用程式能夠被挖角,企業客戶亦可安心在 NVIDIA AI 平台部屬這些獲得認證的技術,包括 Adobe 、 Red Hat 與 VMWare 等百家夥伴也在計畫宣布後入。

同時, NVIDIA AI Enterprise 2.0 也宣布完成最佳化調整與認證,可支援各大資料中心與雲端平台,自裸機伺服器、虛擬化基礎架構至純 CPU 系統等,此套件現在亦可支援包括 Red Hat OpenShift 、 VMWare vSphere wth Tanzu 等環境。

多項重要 AI 工具進行功能性升級

NVIDIA ,在此次 GTC 宣布多項 AI SDK 與工具的新進展,包括超大規模模型推論方案 Triton 、語音 AI SDK Riva 2.0 、大型語言模型訓練框架 NeMo Megatron 0.9 、端對端推薦系統加速 AI 框架 Merlin 1.0 ,以及影音品質強化 SDK Maxine 。

Triton 將在新版本加入三大更新項目,包括用於加速部署完成最佳化模型的 Model Navigator、在 Kubernetes 中進行高效擴展的 Management Service,以及用於樹狀模型上進行推論的森林推論函式庫 (Forest Inference Library),森林推論函式庫能在每個應用程式中實現快速、最佳化和可擴充的 AI 可解釋性。

Riva 2.0 借助預訓練方式具備領先的語音辨識率,能依照產業打造即時語音 AI 應用程式, Riva 2.0 可辨識 7 種與銀辨識,並具備如真人般的男聲與女聲,還可透過 NVIDIA TAO 工具套件進行客製化調整;此次 NVDIIA 還宣布付費版本的 NVIDIA Riva Enterprise ,提供額外的 NVDIIA 企業服務支援。

NeMo Megatron 0.9 大型語言訓練模型框架能使研究人員與企業將模型訓練到收斂並擴大到數兆個參數,能用於對話式 AI 、推薦系統與基因組學等項目,新版本包括最佳化調整與製程配方,能縮減端到端的開發與訓練,同時加入雲端訓練支援,包括晶東、 AI Sweden 、 Never ( LINE )與佛羅里達大學皆為早期使用 NVIDIA 加速運算訓練 LLM 的客戶。

Merlin 1.0 推薦系統 AI 框架在新版本包括兩個全新函式庫,包括 Merlin 模型與 Merlin 系統,資料科學家與機器學習工程師可借助這兩個函式庫判斷哪些功能與模型適合應用在其場景,並將推薦系統管道部屬為微服務。

Maxine 影音品質增強 SDK 是適合應用在遠距會議情境的 AI 影像增強技術,新版本家務回聲消除語音訊超解析兩項功能,可提升通話的清晰度。

多項全新 AI 工具

照片中提到了OP + v• (pu) - 0、Op、Dt,包含了屏幕截圖、產品設計、產品、設計、牌

▲ Modulus 是基於物理原則的人工智慧架構

照片中提到了Transmitter、6G Channel、Receiver,包含了光、設計、產品設計、產品、光

▲為下一世代的 6G 技術研究推出 Sionna 人工智慧架構

照片中提到了愚-關器-自、0-0-0、Self-Supervised,包含了屏幕截圖、產品設計、多媒體、設計、牌

▲針對醫療的 NVIDIA NAOMI 容器包括 2D 與 3D 模型的人工智慧輔助標記、遷移學習與 autoML 訓練

此次黃仁勳也宣布多項全新 AI 框架技術,這邊列出幾項重點項目,首先是遵循真實世界物理特性的 Modulus ,這項架構將物理特性納入人工智慧範疇,能夠在虛擬環境建構出符合真實世界物理特性的情況,尤其對打造數位孿生至關重要。 Sionna 則是鎖定下一代通訊技術 6G 的人工訓練, 6G 將在 2026 底定,但許多基礎技術與發展方針已經底定,也將承襲 5G 高度軟體定義的特色,現在也是超前部屬投入 6G 先期研究的時機;至於 NAOMI 容器是針對醫療影像應用,提供 2D 與 3D 模型的人工智慧輔助標記功能、遷移學習與 autoML 訓練。