Intel 在 Intel Vision 大會宣布旗下 AI 深度學習處理器團隊 Habana Labs 推出第二代 AI 深度學習處理器 Habana Gaudi2 與 Habana Greco ,兩款產品皆基於 7nm 製程(聽起來像是委託台積電生產?), Habana Gaudi2 是鎖定訓練應用,號稱在 ResNet-50 機器視覺模型和 BERT 自然語言處理模型的訓練吞吐量高於 NVIDIA A100 80GB 兩倍,而 Habana Greco 則是針對推論所規劃的架構。
Intel 開放提供既有 Habana 客戶使用 Gaudi2 處理器,同時與 Supermicro 合作,將在今年內推出 Supermicro Gaudi2 Training Server 伺服器,以及與 DDN 合作打造與之配合的 DDN AI400X2 儲存方案。
▲ Gaudi2 是專為推論開發的加速器產品,鎖定機器視覺、自然語言類的 AI 訓練應用
Habana Gaudi2 延續前一代的 Gaudi 架構,借助自 16nm 提升到 7nm 製程,同時提升記憶體與網路架構,還加入壓縮媒體與謝仔仔系統的整合媒體引擎,使整體性能提升,另外借助封裝技術將頻寬達 2.45TB/s 的 96GB HBM2E 記憶體整合,並具備 24 個 100GbE RoCE RDMA NIC 供使用標準乙太網路進行擴充。
Habana Gaudi2 是作為瞄準 NVIDIA GPU 型加速技術的訓練加速器產品,標榜更具經濟效益且訓練速度更快,尤以包括自駕車訓練、醫療影像、產線檢測以及自然語言等最具效益;另外 Intel 也提供 SynapseAI 軟體,針對深度學習模型進行最佳化,可簡化自主流 GPU 訓練的模型進行移植的程序,僅需簡單添加幾行代碼,但亦提供完整的進階開發功能。