在SIGGRAPH 2024,兩家知名的圖庫服務公司分別宣布與NVIDIA合作,透過基於NVIDIA Edify生成式AI框架的技術增強生成式圖像服務;美國知名圖庫素材服務商Shutterstock宣布基於NVDIA技術的3D內容生成服務,美國圖片交易公司蓋帝圖像Getty Images也宣布其生成式圖像服務速度受惠NVIDIA更快、品質更好而且能夠微調。
NVIDIA Edify是一種多模式生成式AI架構,強調能依據獲得許可的資料訓練負責任的生成式模型,並透過NVIDIA DGX Cloud快速擴展模型;Shutterstock推出的商業測試版生成式3D服務能使創作者透過文字與圖像敘述製作3D資產原型,並產生具360 HDRi背景的光線場景;蓋帝圖像則進一步利用NVIDIA技術使生成圖像的時間縮減至一半,同時還提高圖像輸出品質以及能夠進行微調。
▲Shutterstock提供的3D生成功能主要是協助設計師與藝術家快速填補畫面,使他們專注於主要的設計項目
Shutterstock提供的商業測試版3D內容生成服務旨在使設計師、藝術家能快速產生各種3D原型或填充虛擬環境的物件,例如透過生成式AI產生的3D物件補充非主要的內容,設計師就能專注在重點的角色或是物件的設計,省去他們為了填補畫面而額外花費時間。且透過AI不僅能快速完成初步的3D物件,同時一旦設計師或客戶滿意預覽的效果,即可快速的轉化為具有基於物理渲染效果的精緻3D影像。Shutterstock也在大會示範與Blender的工作流整合,使藝術家可在場景視窗中直接產生物件。此外透過生成式AI的幫助,還能將原本在3D場景複雜的光線模擬變得簡單,Shutterstock提供的3D生成服務只需使用自然語言文字敘述或圖片作為參考,即可產生具360 HDRi光線效果的16K解析度3D場景,包括WPP、CGI studio Katana與達梭的3DEXCITE都將導入Shutterstock 的 360 HDRi API。
▲蓋帝圖像將生成式圖像服務的背後升級到Edify,不僅更快而且還可允許自定義模型
蓋帝圖像則是宣布其生成圖像服務升級使用NVIDIA Edify,並提供一系列新功能的AI模型供藝術家選擇構圖與風格,除了較原本的服務提升一倍的圖像產生速度外,還能夠調整鏡頭的景深或焦距,且僅需約6秒即可完成4張圖片並提升至4K解析度(簡單的說就是先產生低解析圖像後透過超解析提高至4K解析度);此外蓋帝提供的商業安全級基礎模型可進行微調,使用其服務的企業可依據自己的資料進行差異訓練,使產生的內容符合企業需求。