日前,美國AI創(chuàng)企Stability AI發(fā)布了Stable Cascade預(yù)覽版。這個模型是基于Würstchen架構(gòu)的文本到圖像擴(kuò)散模型,可以在消費(fèi)級硬件上進(jìn)行訓(xùn)練和微調(diào)。該模型的發(fā)布是根據(jù)非商業(yè)許可證,只允許用于非商業(yè)目的。這意味著用戶可以在自己的項(xiàng)目中免費(fèi)使用這個模型,但不能用于商業(yè)用途。
Stable Cascade是一個神經(jīng)網(wǎng)絡(luò)模型,與其他模型相比,它使用更小的潛在空間進(jìn)行訓(xùn)練和推理。這種高度壓縮的潛在空間使得推理速度更快,訓(xùn)練也更高效。
該模型在人類評估中表現(xiàn)出色,無論是在提示對齊還是美學(xué)質(zhì)量上,Stable Cascade幾乎在所有比較中表現(xiàn)最佳。與其他模型相比,它具有更高的效率和更快的推理速度。
Stable Cascade采用了三個模型:階段A、S。盡管最大的模型參數(shù)比Stable Diffusion XL多14億,但它仍具有更快的推理時(shí)間。這表明穩(wěn)定級聯(lián)的關(guān)注點(diǎn)在于其架構(gòu)和更高度壓縮的潛在空間。
總的來說,Stable Cascade是一個非常高效和性能出色的神經(jīng)網(wǎng)絡(luò)模型,適用于各種用途。它在訓(xùn)練和推理方面取得了令人印象深刻的結(jié)果,展現(xiàn)出其在效率方面的優(yōu)勢。


產(chǎn)品與服務(wù)
聯(lián)系站長
關(guān)于我們