在我們當(dāng)前的人工智能時(shí)代,計(jì)算機(jī)可以通過擴(kuò)散模型生成自己的“藝術(shù)”,迭代地向嘈雜的初始狀態(tài)添加結(jié)構(gòu),直到出現(xiàn)清晰的圖像或視頻。
擴(kuò)散模型突然在每個(gè)人的餐桌上占據(jù)了一席之地:輸入幾個(gè)詞,在現(xiàn)實(shí)與幻想的交匯處體驗(yàn)瞬間的、令人多巴胺飆升的夢(mèng)境。在幕后,它涉及一個(gè)復(fù)雜、耗時(shí)的過程,需要算法進(jìn)行多次迭代才能完善圖像。
麻省理工學(xué)院計(jì)算機(jī)科學(xué)和人工智能實(shí)驗(yàn)室(CSAIL)的研究人員推出了一種新框架,將傳統(tǒng)擴(kuò)散模型的多步驟過程簡(jiǎn)化為單個(gè)步驟,解決了以前的局限性。這是通過一種師生模型來完成的:教授一個(gè)新的計(jì)算機(jī)模型來模仿生成圖像的更復(fù)雜的原始模型的行為。
該方法稱為分布匹配蒸餾 (DMD),可以保留生成圖像的質(zhì)量并允許更快的生成速度。
麻省理工學(xué)院博士 Tianwei Yin 表示:“我們的工作是一種新穎的方法,可以將穩(wěn)定擴(kuò)散和 DALLE-3 等現(xiàn)有擴(kuò)散模型加速 30 倍。”電氣工程和計(jì)算機(jī)科學(xué)專業(yè)的學(xué)生、CSAIL 附屬機(jī)構(gòu)和 DMD 框架的首席研究員。
“這一進(jìn)步不僅顯著減少了計(jì)算時(shí)間,而且保留了(如果不是超越的話)生成的視覺內(nèi)容的質(zhì)量。理論上,該方法將生成對(duì)抗網(wǎng)絡(luò)(GAN)的原理與擴(kuò)散模型的原理結(jié)合起來,實(shí)現(xiàn)了視覺內(nèi)容的生成“一步——與當(dāng)前擴(kuò)散模型所需的數(shù)百步迭代細(xì)化形成鮮明對(duì)比。它可能是一種在速度和質(zhì)量方面都表現(xiàn)出色的新生成建模方法。”
這種單步擴(kuò)散模型可以增強(qiáng)設(shè)計(jì)工具,實(shí)現(xiàn)更快的內(nèi)容創(chuàng)建,并有可能支持藥物發(fā)現(xiàn)和 3D 建模的進(jìn)步,其中及時(shí)性和有效性是關(guān)鍵。
分銷夢(mèng)想
DMD 巧妙地具有兩個(gè)組件。首先,它使用回歸損失,錨定映射以確保圖像空間的粗略組織,從而使訓(xùn)練更加穩(wěn)定。
接下來,它使用分布匹配損失,確保使用學(xué)生模型生成給定圖像的概率與其真實(shí)世界的出現(xiàn)頻率相對(duì)應(yīng)。為此,它利用兩個(gè)擴(kuò)散模型作為指導(dǎo),幫助系統(tǒng)了解真實(shí)圖像和生成圖像之間的差異,并使訓(xùn)練快速的一步生成器成為可能。
標(biāo)簽:
免責(zé)聲明:本文由用戶上傳,與本網(wǎng)站立場(chǎng)無關(guān)。財(cái)經(jīng)信息僅供讀者參考,并不構(gòu)成投資建議。投資者據(jù)此操作,風(fēng)險(xiǎn)自擔(dān)。 如有侵權(quán)請(qǐng)聯(lián)系刪除!