NVIDIA團隊釋出NVLM 1.9多模態大型語言模型，視覺語言媲美GPT-4o、Llama 3-V 40.5B、InternVL 2抗衡

by Chevelle.fu

2024.10.04 01:17PM

NVIDIA研究團隊重磅釋出NVLM 1.0開源多模態大型語言模型，最大版本NVLM-D-72B達720億參數(72B)，開發團隊聲稱其視覺語言精確度媲美業界領先的GPT-4o私有模型以及Llama 3-V 40.5B、InternVL 2等開源模型，在舉出的例子甚至還包括理解迷因圖；不過NVLM 1.0旨在強化AI產業的發展，僅供作為研究，不允許商業使用。

▲以執行長黃仁勳的照片為例展現出色的指令追蹤能力，並為圖片提供高品質且詳盡的描述

▲甚至可以理解迷因圖背後想表達的意涵

NVIDIA研究團隊表示NVLM 1.0可在視覺語言與純文字的項目與領先的大型語言模型相當，甚至在OCRBench 和 VQAv2領先所有的模型，也強調在所有測試項均勝過或至少與私有的GPT-4o打平，同時NVLM-1.0 72B在多模態測試的表現也優於Google的Gemini 1.5 Pro。

資料來源

NVIDIA Reaseach

Chevelle.fu

甚麼都懂一點、甚麼都不精

文章共19777篇

開箱評測

AGi EDM38磁吸式外接SSD固態硬碟！秒擴充iPhone儲存空間、向錄影容量焦慮說掰掰！

8 天前

AGi EDM38磁吸式外接SSD固態硬碟！秒擴充iPhone儲存空間、向錄影容量焦慮說掰掰！

遊戲天堂

多間寶可夢中心將針對黃牛展開新的一波反制手法

凱拉特

9 天前

多間寶可夢中心將針對黃牛展開新的一波反制手法

遊戲天堂

古早訪談揭露任天堂曾為超級瑪利歐64計劃過「正宗續作」

凱拉特

9 天前

古早訪談揭露任天堂曾為超級瑪利歐64計劃過「正宗續作」

新奇搞笑

新型自行車安全反光板為自駕車感測器而生

Twelve

1 個小時前

新型自行車安全反光板為自駕車感測器而生

開箱評測

3C 開箱 | AGi EDM38 | 磁吸式 Type-C 外接式 SSD，iPhone 15 Pro 高畫質錄影沒煩惱！

7 天前

3C 開箱 | AGi EDM38 | 磁吸式 Type-C 外接式 SSD，iPhone 15 Pro 高畫質錄影沒煩惱！

新品資訊

別再問「有充電線嗎？」手機掛繩兼充電線隨用不求人

Twelve

2 個小時前

別再問「有充電線嗎？」手機掛繩兼充電線隨用不求人

遊戲天堂

PlayStation前高層認為GTA6能促進產業發展但不會壓縮獨立遊戲生存空間

凱拉特

5 天前

PlayStation前高層認為GTA6能促進產業發展但不會壓縮獨立遊戲生存空間

新奇搞笑

橫濱的神秘咖啡館不解開謎團無法離開

Twelve

53 分鐘前

橫濱的神秘咖啡館不解開謎團無法離開

開箱評測

影片隨錄隨存超方便，AGI EDM38 1TB 磁吸外接式固態硬碟開箱試用

10 天前

影片隨錄隨存超方便，AGI EDM38 1TB 磁吸外接式固態硬碟開箱試用