NVIDIA推出NVIDIA NeMo Retirever企業級生成式AI微服務，為聊天機器人、Copilot與摘要工具提供商機 (204467)

NVIDIA宣布擴展NVIDIA NeMo系列框架工具，推出NVIDIA NeMo Retirever企業級生成式AI微服務，使企業可將客製化大型語言模型與企業資料連接，旨在為聊天機器人、Copilot與摘要工具提供商機。NVIDIA NeMo Retirever將經過NVIDIA最佳化的檢索增強生成功能添加至人工智慧代工服務中。目前開發者已能夠率先註冊與體驗NVIDIA NeMo Retirever，對於需要最大化推論效能的開發者，可在搭載TensorRT-LLM軟體的NVIDIA GH200 Superchip的系統執行模型。

並且作為NVIDIA AI Enterprise軟體平台的一部分，開發者企業可透過AWS Marketplace中獲得，包括Cadence、Dropbox、SAP、ServiceNow等皆率先取得NVIDIA NeMo Retirever並投入應用。EDA領導廠商Candance透過NVIDIA NeMo Retirever提供檢索增強生成功能，提供於工業電子設計的生成式AI應用。

▲相較開源RAG方案，NVIDIA NeMo Retirever能使企業在安全、可靠且能夠獲得資源的環境打造客製化模型與相關服務

NVIDIA NeMo Retirever的目的是提供企業建置、客製化與部署生成式AI模型，能夠協助企業透過企業級RAG(檢索增強生成)功能使生成式AI能以企業資料提供客製化功能，相較開源RAG工具，NVIDIA NeMo Retirever利用商業上可執行的模型、API穩定性與安全性修補程式與企業支援提供生產就緒的生成式AI。

NVIDIA透過最佳化演算法為Retriever的嵌入式模型提供高精度的結果，藉由最佳化嵌入模型捕捉單字的關聯，使大型語言模型能處理與分析文字資料。企業透過NeMo Retirever可將大型語言模型連接到多個來源與知識庫，使用者能藉此輕鬆與資料進行互動，並透過簡單的對話獲取精準、即時的答案，且基於NeMo Retirever的應用程式可使企業在高度安全環境取得如文字、PDF、圖片與影像等多元內容。

Chevelle.fu

猜你喜歡

Chevelle.fu

相關消息