Llama 3.1 全攻略 (159134) - Cool3c

最新 | 熱門

中國 AI 新創 DeepSeek 宣稱模型性能超越大型科技公司

DeepSeek 表示其人工智慧模型性能優於大多數大型科技公司，且開發成本相對較低，引起業界關注。中國人工智慧新創DeepSeek近期推出的同名免費App，在短時間內於美國等地區的App Store吸引大量用戶下載使用，其中標榜其使用開源設計的人工智慧模型「DeepSeek V3」性能超越Meta的Llama 3.1，更與Anthropic的Claude-3.5、OpenAI的GPT-4o性能相當，同時模型背後所需硬體算力更遠低於市場其他競爭對手，而開發成本甚至不到600萬美元。 DeepSeek於2023年4月創立，創辦人梁文鋒同時也是量化對沖基金幻方量化 (High-Flyer)創辦人，

Mash Yang

照片中提到了NVIDIA AI FOUNDRY，包含了插圖、英偉達、台積電、英偉達、納斯達克股票代碼：NVDA

NVIDIA 助 Meta Llama 3.1 打造客製化人工智慧

NVIDIA 宣布與 Meta 合作，透過 NVIDIA AI Foundry 服務和 NVIDIA NIM 微服務，協助企業運用 Llama 3.1 大型自然語言模型打造客製化人工智慧應用。針對Meta稍早公布可對應4050億組參數規模的大型自然語言模型Llama 3.1，NVIDIA在稍早對外說明Llama 3.1以超過16000組NVIDIA H100加速器、超過15兆個詞元 (token)資料集訓練而成，並且透過NVIDIA AI Foundry服務與NVIDIA NIM微服務讓企業打造各類客製化人工智慧應用功能。 NVIDIA表示，其NVIDIA AI Foundry服務是以NVI

Mash Yang

照片中提到了Meta Al imagine me as royalty、@Meta Al imagine me as an astronaut、Meta Al imagine me as a 30 sticker，跟Cortana有關，包含了元人工智能、元人工智能、人工智能、駱駝、人工智慧現狀

Meta 推出 Llama 3.1 開源模型性能超越 GPT-4o

Meta 發布新版 Llama 3.1 開源模型，最大規模達 4050 億參數，性能超越 GPT-4o 與 Claude 3.5 Sonnet。今年4月宣布推出開源大型自然語言模型Llama 3之後，Meta稍早再宣布推出新版Llama 3.1，最大規模可對應4050億組參數，同樣以開源形式對外提供使用。而Llama 3.1是以超過16000組NVIDIA H100加速器，以及超過15兆個詞元 (token)資料集進行訓練，但未說明資料集具體來源。隨著此次釋出Llama 3.1，Meta同時也將Llama 3的700億及80億組參數版本進行升級。同時，Llama 3.1同樣以開源形式對外

Mash Yang

照片中提到了க்க、NVIDIA AI FOUNDRY，包含了平面設計、台積電、股票、股市、金融

NVIDIA AI Foundry為全球企業提供基於Llama 3.1的客製化生成式AI模型，可搭配Llama 3.1 405B和NVIDIA Nemotron進行訓練

隨著Meta推出Llama 3.1，作為全球AI產業關鍵技術供應者的NVIDIA也旋即宣布透過NVIDIA AI Foundry與NVIDIA NIM推論微服務提供支援，使企業能基於全新的Llama 3.1訓練專屬的客製化生成式AI模型，更可藉由超大參數的Llama 3.1 405B和NVIDIA Nemotron建構「超級模型」；其中諮詢管理公司埃森哲(Accenture)已率先使用NVIDIA AI Foundry訓練專屬的Llama 3.1客製化模型，而沙烏地阿拉伯國家石油公司、AT&T、Uber等企業亦導入全新的Llama NVIDIA NIM推論微服務，並提供量身打造的AI

Chevelle.fu

相關文章