科技應用 Stability AI 開源模型 Stable Audio Open Stability AI 推出 Stable Audio Open 開源模型 文字生成 47 秒音效 Stable Audio Open 開源模型能以文字描述生成約 47 秒聲音內容,模型是以超過 48 萬筆合法聲音紀錄訓練,適用於環境音效及內容創作。 Stability AI宣布釋出能以文字描述自動生成聲音內容的Stable Audio開源版本,並且以Stable Audio Open為稱,將可依照文字內容生成約47秒長度聲音內容。 Stable Audio Open模型是以超過48萬筆聲音紀錄進行訓練,其中超過90%資料源自免費聲音資料庫Freesound,同時也有部分聲音源自Free Music Archive (FMA),並且強調所有聲音內容都事先合法取得使用許可。 至於文字內容理解部 Mash Yang 10 個月前