原文來源:AIGC開放社區(qū)
圖片來源:由無界 AI生成
11月29日,,著名開源生成式AI平臺Stability.ai在官網(wǎng)發(fā)布了,,開源文生圖模型SDXL Turbo,。
根據(jù)使用體驗,SDXL Turbo的生成圖像效率非???,可以做到實時響應(yīng)(可能小于1秒)。
在你輸入完最后一個文本后,,圖像就能馬上顯示,,推理效率超過了Midjourney、DALL·E 3以及Stability.ai自己開發(fā)的Stable Difusion系列模型,。
天下武功,,無堅不破,唯快不破,,SDXL Turbo就是大模型界的“博爾特”,。用風(fēng)馳電掣、電光石火,、疾風(fēng)驟雨來形容SDXL Turbo都不過分,。
「AIGC開放社區(qū)」介紹了那么多的文生圖模型,截至目前這個是響應(yīng)最快,,并且生成的圖像質(zhì)量非常高,,精準(zhǔn)還原提示文本的描述。
開源地址:https://github.com/Stability-AI/generative-models?
在線體驗地址:https://clipdrop.co/stable-diffusion-turbo?
論文地址:https://stability.ai/s/adversarial_diffusion_distillation.pdf?
SDXL Turbo簡單介紹
SDXL Turbo是基于SDXL 1.0開發(fā)而成,,并且使用了一種全新的對抗擴散蒸餾技術(shù)(ADD),,將圖像所需的生成步驟從50減少至1—4步,并且絲毫不影響圖像質(zhì)量,。稍后「AIGC開放社區(qū)」會詳細介紹這篇論文,。
該技術(shù)可以在高質(zhì)量圖像下以1—4個步驟對大規(guī)?;A(chǔ)圖像擴散模型進行采樣。使用分?jǐn)?shù)蒸餾來利用大規(guī)?,F(xiàn)成的圖像擴散模型作為指導(dǎo),。
并將其與對抗網(wǎng)絡(luò)相結(jié)合,以確保即使在一個或兩個采樣步驟的低步驟狀態(tài)下也能確保高圖像保真度,,同時避免了其他蒸餾方法中常見的失真或模糊問題,。
SDXL Turbo實驗數(shù)據(jù)
為了測試SDXL Turbo的性能,Stability.ai使用相同的文本提示,,與StyleGAN-T++,,OpenMUSE,IF-XL,,SDXL和LCM-XL等不同版本的文生圖模型進行了比較,。
測試結(jié)果顯示,SDXL Turbo只用一個生成步驟,,就擊敗了LCM-XL的4步驟生成的圖像,,以及擊敗了SDXL通過50個步驟生成的圖像。
雖然SDXL Turbo功能很強,,也有一些局限性,。Stability.ai表示,目前SDXL Turbo只能用于學(xué)術(shù)研究,,稍后會開放商業(yè)權(quán)限,。
此外,SDXL Turbo只能生成512×512固定像素的圖片,,對一些細節(jié)可能表現(xiàn)的不夠好,,例如,人的手指,、面部表情等,,無法完美的展現(xiàn)照片級真實感。
但SDXL Turbo對擴散模型的生成效率,、質(zhì)量實現(xiàn)了重大技術(shù)突破,,可以幫助中小型企業(yè)以更低的成本來進行部署使用。
免責(zé)聲明:本文來自網(wǎng)絡(luò)收錄或投稿,觀點僅代表作者本人,,不代表芒果財經(jīng)贊同其觀點或證實其描述,,版權(quán)歸原作者所有。轉(zhuǎn)載請注明出處:http://lequren.com/1080977.html
溫馨提示:投資有風(fēng)險,,入市須謹(jǐn)慎,。本資訊不作為投資理財建議。