NVIDIA宣布擴展NVIDIA NeMo系列框架工具,推出NVIDIA NeMo Retirever企業級生成式AI微服務,使企業可將客製化大型語言模型與企業資料連接,旨在為聊天機器人、Copilot與摘要工具提供商機。NVIDIA NeMo Retirever將經過NVIDIA最佳化的檢索增強生成功能添加至人工智慧代工服務中。目前開發者已能夠率先註冊與體驗NVIDIA NeMo Retirever,對於需要最大化推論效能的開發者,可在搭載TensorRT-LLM軟體的NVIDIA GH200 Superchip的系統執行模型。
並且作為NVIDIA AI Enterprise軟體平台的一部分,開發者企業可透過AWS Marketplace中獲得,包括Cadence、Dropbox、SAP、ServiceNow等皆率先取得NVIDIA NeMo Retirever並投入應用。EDA領導廠商Candance透過NVIDIA NeMo Retirever提供檢索增強生成功能,提供於工業電子設計的生成式AI應用。
▲相較開源RAG方案,NVIDIA NeMo Retirever能使企業在安全、可靠且能夠獲得資源的環境打造客製化模型與相關服務
NVIDIA NeMo Retirever的目的是提供企業建置、客製化與部署生成式AI模型,能夠協助企業透過企業級RAG(檢索增強生成)功能使生成式AI能以企業資料提供客製化功能,相較開源RAG工具,NVIDIA NeMo Retirever利用商業上可執行的模型、API穩定性與安全性修補程式與企業支援提供生產就緒的生成式AI。
NVIDIA透過最佳化演算法為Retriever的嵌入式模型提供高精度的結果,藉由最佳化嵌入模型捕捉單字的關聯,使大型語言模型能處理與分析文字資料。企業透過NeMo Retirever可將大型語言模型連接到多個來源與知識庫,使用者能藉此輕鬆與資料進行互動,並透過簡單的對話獲取精準、即時的答案,且基於NeMo Retirever的應用程式可使企業在高度安全環境取得如文字、PDF、圖片與影像等多元內容。