ServiceNow、Hugging Face與NVIDIA宣布共同推出開放大型語言模型StarCode2,可用於程式碼生成,提供效能、透明度與成本效益;StarCode2與由ServiceNow和Hugging Face共同管理的BigCode社群共同開發,經過619種程式語言訓練,能進一步在企業進行訓練與嵌入執行特定任務,諸如原始程式碼生成、工作流程生成、文章摘要等,開發人員可藉此加速創新與提升生產力。
StarCode 2提供三種模型大小,包括ServiceNow訓練的30億(3B)參數模型、Hugging Face訓練的70億(7B)參數模型,與透過NVIDIA NeMo建構以及在NVIDIA加速基礎設施訓練的150億(15B)參數模型;StarCode2較小的運算模型能兼具效能與降低運算成本,且透過新一代技術與訓練方式,StarCode 3B模型的效能足以媲美原始StarCode 15B模型效能。
StarCode2相關資訊可參閱BigCode頁面:Big Code
▲StarCode2提供三種規模的模型,光是3B模型的性能以媲美前一代15B模型
StarCode2增強客製化應用開發
StarCode2採用先進的架構,並使用來自BigCode整合的資料源,優先考慮透明度與開放治理,藉此實現大規模且負責任的創新;StarCode2具備如文字轉程式碼與文字轉工作流程等ˋ功能,可提升未來AI驅動的程式碼應用潛力;透過StarCode2,可為儲存庫提供上下文、進而實現準確且情感感知的偵測行為,並適用於經驗豐富的軟體工程師與一般開發者,加速商業價值與數位轉型。StarCode2建構在Stack v2程式碼資料集,相較Stack v1大了七倍以上,。同時透過新訓練技術還可幫助模型理解如COBOL等低資源程式語言、數學與程式原始碼討論。
利用特定業務資料微調進階功能
同時,StarCode2可利用如NVIDIA NeMo或Hugging Face TRL等開源工具,依據產業及組織特定的資料進行微調,使基於StarCode2的聊天機器人可處理更複雜與特定領域的摘要或分類任務,提供個人化的程式設計助手加速完成程式設計任務、檢索相關程式碼片段與起用文字轉工作任務流程功能;ServiceNow的文字轉程式碼Now LLM建構在具15B參數的StarCode的專門版本上,並針對工作流程模式、用例與流程進行微調,Hugging Face也同樣利用該模型建構StarChat助手。
BigCode促進AI領域的開放科學合作
BigCode象徵由Hugging Face與ServiceNow領導的開放式科學合作,並致力於負責任的開發用於程式碼的語言模型;BigCode社群透過工作小組與任務小組參與StarCode2計畫的技術工作,並由不同的組織進行3種大小的StarCode2模型訓與最佳化。
StarCode2以促進負責任的創新為宗旨,體現BigCode開放治理、透明供應鏈、開源軟體使用與開發人員具備自訓練中排除特定資料的能力,StarCode2是在Inria託管的Software Heritage數位共享授權下使用來源可靠的資料進行訓練。
StarCode2與前身都是在BigCode Open RAIL-M許可提供,允許免版稅存取與使用,並為了進一步促進透明度與協作,除了可自Hugging Face取得所有模型,StarCode2的支援程式碼也繼續存放在BigCode專案的GitHub頁面,另外NVIDIA AI Foundation模型也可獲得StarCode2 15B模型,供開發者自瀏覽器或API端點進行實驗。