聯發科推出繁體中文大型語言模型「BreeXe」與自動生成式人工智慧服務平台「MediaTek DaVinci」

2024.04.09 04:58PM
照片中提到了MEDIATEK、ASSISTANT、10,跟聯發科有關,包含了davinci 達哥生成式ai 平台logo、生成式人工智能、人工智能

聯發科強調「BreeXe」是當前繁體中文能力表現最好的模型,並且能以 450 億組參數規模超越 OpenAI 的 GPT 3.5 表現,單次可處理超過 4 萬字的文字內容。

聯發科在今年釋出其對應70億組參數規模的大型自然語言模型Breeze-7B之後,此次再次推出名為「BreeXe」的大型語言模型,以及相應的自動生成式人工智慧服務平台「MediaTek DaVinci」,更以「達哥」作為暱稱

依照聯發創新基地負責人許大山博士說明,「BreeXe」是由聯發科位於英國劍橋、倫敦,以及台大創新機第三方合作打造的大型自然語言模型,更強調「BreeXe」是當前繁體中文能力表現最好的模型,並且能以450億組參數規模超越OpenAI的GPT 3.5表現,單次可處理超過4萬字的文字內容,更比Mistral AI提出的客製化模型Mistral對應10倍以上執行能力。

而針對台灣地區使用繁體中文處理能力,聯發科強調加入諸多在地化微調訓練,甚至也加入理解諸多在地用語設計,例如可以理解「母湯」是台語「不行」意思,而不會像之前會理解成「粵語」內容。

同時,「BreeXe」透過NVIDIA提供的Taipei-1超級電腦DGX GH200進行訓練,接下來也計畫將「BreeXe」處理能力提升達GPT-4等級。

至於對於自動生成式人工智慧服務平台「MediaTek DaVinci」的看法,聯發科以瑞士刀作為比喻,將透過此平台結合不同外掛資源,使其能對應不同應用場景,讓更多結合人工智慧的服務可以更快藉此服務平台建構。

目前「MediaTek DaVinci」除了收錄「BreeXe」,先前也已經收錄包含微軟旗下人工智慧模型,以及OpenAI的GPT、DALL.E3,更包含Anthropic日前推出的Claude 3,期望能透過此平台協助更多開發者、企業導入自動生成式人工智慧應用資源。