Stable Cascade 是 Stability AI 推出新一代文生圖模型,號稱比 SDXL 更高效更強悍,相關數據已經在 GitHub 頁面上公開,但僅允許非商業用途使用。
Stable Cascade 建立在 Würstchen 架構上,號稱可以在消費級硬體上進行簡單的訓練和微調。
基本介紹
- 軟體名稱:Stable Cascade
- 上線時間:2024年2月
- 開發商: Stability AI
工作原理,運行環境,模型性能,
工作原理
當用戶輸入文段後,相關內容會被 Stable Cascade 模型轉換為 24x24 體積的小型數據集合,此後模型將解碼這些小型圖像數據生成圖片,並繼續將圖片放大為高解析度圖像,由於系列步驟之間彼此分離,因此可以對模型各方面進行各種額外訓練及微調。
運行環境
Stability AI 表示,由於 Stable Cascade 模型採用如此“模組化”設計,因此能夠有效降低推理使用的顯存,號稱只需要 20 GB 顯存即可運行。
模型性能
全新的 Stable Cascade 模型在性能及聲稱內容質量上均有所提升。Stable Cascade 模型與 Playground v2、SDXL、SDXL Turbo、Würstchen v2 等業界文生圖競品進行比較,號稱無論是提示詞對齊(Prompt Alignment)還是在生成的圖片細節上,Stable Cascade“幾乎都是表現最佳的模型”。而在推理速度方面,即便 Stable Cascade 最大的模型比 Stable Diffusion XL 多出 14 億參數,仍然具有更快的推理速度。