亚洲色熟女激情精品,日韩久久女同一区精品

迪士尼新研究實(shí)現(xiàn)百萬(wàn)像素圖像和視頻換臉，說不定未來大熒幕電影也會(huì)使用換臉技術(shù)了。

deepfakes 技術(shù)可以用于圖像和視頻換臉，但它能否用于大制作電影和電視節(jié)目中呢？迪士尼最新放出的一則視頻 demo 展示了這種可能性。

近日迪士尼在歐洲圖形學(xué)會(huì)透視研討會(huì)（EGSR）上發(fā)表研究，展示了首個(gè)百萬(wàn)像素逼真換臉技術(shù)。

效果是不是還不錯(cuò)。這樣的效果雖然并不足以用于漫威電影，但它是換臉技術(shù)邁出的新一步。

來自迪士尼的研究者表示，這項(xiàng)技術(shù)的創(chuàng)新點(diǎn)在于能夠達(dá)到百萬(wàn)像素質(zhì)量。百萬(wàn)像素或許不再是高質(zhì)量圖像的代名詞，畢竟手機(jī)自帶攝像頭就能達(dá)到千萬(wàn)像素。但是截至目前，換臉技術(shù)一直注重平滑的面部轉(zhuǎn)換，不注重提高像素。

你可能在手機(jī)上看到過效果好到爆炸的換臉視頻，但是如果把它們放在更大的屏幕上呈現(xiàn)，就會(huì)出現(xiàn)很多瑕疵。研究者表示，他們用開源 deepfake 模型 DeepFakeLab 創(chuàng)建的視頻分辨率最高也只有 256*256 像素。相比之下，迪士尼新模型能夠讓視頻的分辨率提升到 1024*1024 像素。

那么，百萬(wàn)像素?fù)Q臉是如何實(shí)現(xiàn)的呢？

首個(gè)百萬(wàn)像素?fù)Q臉方法

迪士尼的這項(xiàng)研究發(fā)表在歐洲圖形學(xué)會(huì)透視研討會(huì)（EGSR）上，提出了一種在圖像和視頻中實(shí)現(xiàn)全自動(dòng)換臉的算法。據(jù)研究者稱，這是首個(gè)渲染百萬(wàn)像素逼真結(jié)果的方法，且輸出結(jié)果具備時(shí)序一致性。

具體來說，該研究提出了一個(gè)漸進(jìn)式訓(xùn)練的多路 comb 網(wǎng)絡(luò)，以及一種保持亮度和對(duì)比度的混合方法。

具體而言，雖然漸進(jìn)式訓(xùn)練能夠生成高分辨率圖像，但將架構(gòu)和訓(xùn)練數(shù)據(jù)擴(kuò)展至兩人以上可以使生成的表情具備更高的保真度。

此外，在將生成的表情合成到目標(biāo)人臉時(shí)，研究者調(diào)整混合策略，以保持對(duì)比度和低頻光照。

最后，研究者在人臉關(guān)鍵點(diǎn)穩(wěn)定算法中融入了一種細(xì)化策略，以實(shí)現(xiàn)時(shí)序穩(wěn)定性，這對(duì)于處理高分辨率視頻來說至關(guān)重要。

在實(shí)驗(yàn)部分，研究者通過控制變量研究來驗(yàn)證該方法對(duì)換臉質(zhì)量的影響，并與流行的 SOTA 方法進(jìn)行了比較。

百萬(wàn)像素分辨率下執(zhí)行逼真換臉的整體流程：

該流程包括如下四個(gè)步驟：

對(duì)于圖像 x_t，檢測(cè)人臉并定位人臉關(guān)鍵點(diǎn)；

將人臉分辨率歸一化為 1024×1024，保存歸一化參數(shù)；

將歸一化人臉饋入網(wǎng)絡(luò)，并保存第 s 個(gè)解碼器的輸出 x？_s；

使用步驟 2 保存的歸一化參數(shù)，在圖像 x？_s 上反轉(zhuǎn)圖像歸一化結(jié)果。最后，借助該研究提出的合成方法，將生成的圖像與圖像 x_t 混合。

而該流程中，最核心的組件無疑是模型本身了。該研究使用的單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu)：

此外，研究者還介紹了實(shí)現(xiàn)人臉關(guān)鍵點(diǎn)對(duì)齊和穩(wěn)定的方法，以確保換臉圖像的時(shí)序一致性，以及保持光照和對(duì)比度的圖像合成流程。此處不再贅述，詳情參見原論文。

與當(dāng)前 SOTA 方法的對(duì)比

該方法與 DeepFakes、DeepFaceLab 和 Nirkin 等人提出方法的換臉效果對(duì)比。從左到右依次為：目標(biāo)圖像、源圖像、該方法在 1024×1024 和 256×256 分辨率下的成像效果，以及其他三種方法的成像效果。

控制變量研究

研究者執(zhí)行以下四種實(shí)驗(yàn)，來查看該研究提出的單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu)和算法對(duì)換臉質(zhì)量的影響：

漸進(jìn)式訓(xùn)練 VS 一次性訓(xùn)練整個(gè)網(wǎng)絡(luò)；

使用多路 comb 模型 VS 單獨(dú)的雙路模型；

該研究提出的保持對(duì)比度的多頻段合成方法 VS 泊松融合方法；

該研究中人臉關(guān)鍵點(diǎn)穩(wěn)定方法的影響。

為漸進(jìn)式訓(xùn)練與非漸進(jìn)式訓(xùn)練的成像效果對(duì)比，可以看出，漸進(jìn)式訓(xùn)練的成像效果優(yōu)于非漸進(jìn)式訓(xùn)練。

為使用多路 comb 模型與雙路模型的成像效果對(duì)比：

方法與泊松融合方法的成像效果對(duì)比。從圖中可以看出，該方法可以更好地保留目標(biāo)人臉的全局光照特征，而泊松融合方法導(dǎo)致人臉出現(xiàn)了某種「漂白」效果。

人臉關(guān)鍵點(diǎn)穩(wěn)定結(jié)果：

缺陷

盡管能夠以高分辨率進(jìn)行逼真的人臉轉(zhuǎn)換，但是迪士尼提出的這一方法仍然存在缺陷。例如，無法基于數(shù)據(jù)恰當(dāng)捕獲的表情和姿勢(shì)，可能會(huì)導(dǎo)致不完善的生成結(jié)果，比如模糊和其它偽影。
責(zé)任編輯:pj

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

解碼器

解碼器

+關(guān)注

關(guān)注
9

文章
1225

瀏覽量
43786
編碼器

編碼器

+關(guān)注

關(guān)注
45

文章
4013

瀏覽量
143442
數(shù)據(jù)

數(shù)據(jù)

+關(guān)注

關(guān)注
8

文章
7349

瀏覽量
95054

日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

Nirkin提出單編碼器 - 多解碼器網(wǎng)絡(luò)架構(gòu)和算法對(duì)換臉質(zhì)量的影響

評(píng)論