Stable Audio Open 全攻略 (158301) - Cool3c

最新 | 熱門

Stability AI 推出 Stable Audio Open 開源模型文字生成 47 秒音效

Stable Audio Open 開源模型能以文字描述生成約 47 秒聲音內容，模型是以超過 48 萬筆合法聲音紀錄訓練，適用於環境音效及內容創作。 Stability AI宣布釋出能以文字描述自動生成聲音內容的Stable Audio開源版本，並且以Stable Audio Open為稱，將可依照文字內容生成約47秒長度聲音內容。 Stable Audio Open模型是以超過48萬筆聲音紀錄進行訓練，其中超過90%資料源自免費聲音資料庫Freesound，同時也有部分聲音源自Free Music Archive (FMA)，並且強調所有聲音內容都事先合法取得使用許可。至於文字內容理解部

Mash Yang

科技應用

Stability AI 推出 Stable Audio Open 開源模型文字生成 47 秒音效

Mash Yang

10 個月前

Stability AI 推出 Stable Audio Open 開源模型文字生成 47 秒音效

相關文章