Facebook 翻譯年糕要變實用了,Meta 發表可翻譯 200 種不同語言的 NLLB-200 AI 語言模型

2022.07.07 03:38PM

基於 AI 技術的語言翻譯功能是許多人在閱讀以及與海外人士溝通的利器, Facebook 也推出名為「翻譯年糕」的多國語言翻譯功能,只不過目前翻譯成中文常常會變成「りしれ供さ小」;不過今日 Facebook 母公司 Meta 宣布推出 MLLB-200 AI ,強調可翻譯達 200 種語言,且品質大幅升,旨在加速打破實現元宇宙溝通的語言隔閡,並逐步在 Facebook 動態消息、 Instgram 與其他平台支援高達 250 億則翻譯內容。 Meta 也將此成果於 GitHub 開源提供研究人員改善翻譯工具,釋出包括 NLLB-200 、 FLORES-200 、模型訓練程式碼與重建資料集的程式碼: NLLB-200 開源專案

照片中提到了Instagram、Pamejer、nes,包含了材料、語言、翻譯、機器翻譯、人工智能

▲ Meta 希冀借助更精確的翻譯工具,加速元宇宙溝通

MLLB-200 是「絕不拋下任何語言( No Language Left Behind )」專案的成果,強調是全球第一款能翻譯達 200 種語言的 AI 模型,包括多數翻譯工具無法支援的非洲語言與少數語言,強調既有翻譯工具品質提升達 44% ,同時與維基媒體基金會改善維基百科的翻譯系統。

MLLB-200 的成果將用於支援 Facebook 動態消息, Instgram 與 Meta 其他平台的內容翻譯,標榜只要一鍵即可將不同的語言轉化為熟悉的文字,同時也提供 20 萬美金的補助金給非營利組織,推廣 MLLB-200 在實體世界的應用。

照片中提到了Comparison of NLLB-200 with existing SOTA、BLEU SCORE、50,包含了語言、語言、翻譯、機器翻譯、語言障礙

▲強調 NLLB-200 相較其他語言模型具更高的翻譯品質

在此次開放的套件當中, FLORES-200 是作為多對多評估的資料集,可供研究人員評估 NLLB-200 在各種語言的運作成效,強調比其它語言 AI 的品質高出 44% ,尤其在部分非洲與印度語言提升 70% 品質; Meta 希望借助開放一系列 NLLB-200 相關原始碼與工具,使其他研究者能活用到更多語言。

3 則回應

  • FB 的翻譯是我見過最槽的
    2022-07-08
  • hoo.gl/sGce
    2022-07-08
  • 感覺需要大量的校正,不過很期待夠好用的一天。
    2022-07-08