日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英偉達(dá)推出基于風(fēng)格的生成器新結(jié)構(gòu),GAN 2.0橫空出世

DPVg_AI_era ? 來(lái)源:lq ? 2018-12-16 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達(dá)推出基于風(fēng)格的生成器新結(jié)構(gòu),由此得到的升級(jí)版GAN圖像生成效果逼真到可怕!將面部細(xì)節(jié)分離出來(lái),由模型進(jìn)行單獨(dú)調(diào)整,從而大幅度超越其他模型,GAN 2.0橫空出世?

GAN 2.0來(lái)了?!

我們知道GAN能夠生成逼真的圖片,但沒(méi)有想到字面意義上的“逼真”會(huì)如此快到來(lái)。

下面是一組完全由計(jì)算機(jī)生成的圖片,重復(fù)一遍:全部是計(jì)算機(jī)生成的圖片!

這組效果驚艷到可怕的成果,出自英偉達(dá)的研究人員最近提出的一種新的生成器架構(gòu),基于風(fēng)格遷移,將面部細(xì)節(jié)分離出來(lái),由模型進(jìn)行單獨(dú)調(diào)整,從而大幅度超越傳統(tǒng)GAN等模型,生成的面部圖像結(jié)果簡(jiǎn)直逼真到可怕,可以說(shuō)是GAN 2.0。

這種生成器架構(gòu)提取的圖像風(fēng)格,不是筆劃或顏色空間,而是圖像的組成(居中,向左或向右看等)和臉部的物理特征(膚色,雀斑,頭發(fā))。

該研究的論文已經(jīng)發(fā)表在Arxiv上:

https://arxiv.org/pdf/1812.04948.pdf

連Ian Goodfellow也服氣!

圖像逼真到可怕,能生成世界萬(wàn)物

有CV研究人員看過(guò)上圖效果以后表示,機(jī)器學(xué)習(xí)模型非常擅長(zhǎng)生成逼真的人臉,但這個(gè)新架構(gòu)生成的人臉圖像已經(jīng)真實(shí)到讓我再也不敢相信機(jī)器。

英偉達(dá)研究人員在論文中寫(xiě)道,他們提出的新架構(gòu)可以完成自動(dòng)學(xué)習(xí),無(wú)監(jiān)督地分離高級(jí)屬性(例如在人臉上訓(xùn)練時(shí)的姿勢(shì)和身份)以及生成圖像中的隨機(jī)變化,并且可以對(duì)合成進(jìn)行更直觀且特定于比例的控制。

換句話說(shuō),這種新的GAN在生成和混合圖像,特別是人臉圖像時(shí),可以更好地感知圖像之間有意義的變化,并且在各種尺度上針對(duì)這些變化做出引導(dǎo)。

例如,研究人員使用的舊系統(tǒng)可能產(chǎn)生兩個(gè)“不同”的面部,這兩個(gè)面部其實(shí)大致相同,只是一個(gè)人的耳朵被抹去了,兩人的襯衫是不同的顏色。而這些并不是真正的面部特異性特征,不過(guò)系統(tǒng)并不知道這些是無(wú)需重點(diǎn)關(guān)注的變化,而當(dāng)成了兩個(gè)人來(lái)處理。

在上面的動(dòng)圖中,其實(shí)面部已經(jīng)完全變了,但“源”和“樣式”的明顯標(biāo)記顯然都得到了保留,例如最底下一排圖片的藍(lán)色襯衫。為什么會(huì)這樣?請(qǐng)注意,所有這些都是完全可變的,這里說(shuō)的變量不僅僅是A + B = C,而且A和B的所有方面都可以存在/不存在,具體取決于設(shè)置的調(diào)整方式。

下面這些由計(jì)算機(jī)生成的圖像都不是真人。但如果我告訴你這些圖像是真人的照片,你可能也不會(huì)懷疑:

這個(gè)模型并不完美,但確實(shí)有效,而且不僅僅可用于人類,還能用于汽車、貓、風(fēng)景圖像的生成。

所有這些類型的圖像都或多或少可以單獨(dú)隔離出來(lái),再現(xiàn)小型、中型和大型特征的相同范例。

基于風(fēng)格的生成器架構(gòu):生成圖像效果質(zhì)的飛躍

英偉達(dá)研究人員介紹,新的生成器在傳統(tǒng)的分布質(zhì)量指標(biāo)方面改進(jìn)了最先進(jìn)的技術(shù),使得插值特性明顯變好,并且更好地解決了變量隱因子問(wèn)題。

傳統(tǒng)生成器架構(gòu)和基于風(fēng)格的生成器架構(gòu)對(duì)比

傳統(tǒng)方式中,隱碼(latent code)是通過(guò)輸入層提供給生成器的,即前饋網(wǎng)絡(luò)的第一層(圖1a)。而英偉達(dá)團(tuán)隊(duì)完全省略了輸入層,從一個(gè)學(xué)習(xí)的常量(learned constant)開(kāi)始,從而脫離了傳統(tǒng)的設(shè)計(jì)(圖1b,右)。在輸入隱空間Z中,給定一個(gè)隱碼z,一個(gè)非線性網(wǎng)絡(luò) f:Z→W首先生成w∈W(圖1b,左)。

英偉達(dá)團(tuán)隊(duì)的發(fā)生器架構(gòu)可以通過(guò)對(duì)樣式進(jìn)行特定尺度的修改來(lái)控制圖像合成??梢詫⒂成渚W(wǎng)絡(luò)和仿射變換看作是一種從學(xué)習(xí)分布(learned distribution)中為每種樣式繪制樣本的方法,而將合成網(wǎng)絡(luò)看作是一種基于樣式集合生成新圖像的方法。修改樣式的特定子集可能只會(huì)影響圖像的某些方面。

樣式混合

英偉達(dá)團(tuán)隊(duì)采用混合正則化,其中給定比例的圖像是使用兩個(gè)隨機(jī)隱碼生成的,而不是一個(gè)在訓(xùn)練期間生成給定百分比的圖像。

在生成這樣的圖像時(shí),只需在合成網(wǎng)絡(luò)中隨機(jī)選擇的一個(gè)點(diǎn)上,從一個(gè)隱碼切換到另一個(gè)——稱之為樣式混合的操作。

表2顯示了在訓(xùn)練過(guò)程中啟用混合正則化是如何產(chǎn)生顯著改進(jìn)的,在測(cè)試時(shí)混合了多個(gè)延遲的場(chǎng)景中,改進(jìn)的FID表明了這一點(diǎn)。

表2

圖3給出了在不同尺度上混合兩個(gè)潛碼合成圖像的例子??梢钥吹?,樣式的每個(gè)子集控制圖像的高級(jí)屬性。

圖3

隨機(jī)變化

人類肖像中有許多方面可以被視為隨機(jī)的,例如毛發(fā),雀斑或皮膚毛孔的確切位置。只要它們遵循正確的分布,任何這些屬性都可以隨機(jī)化而不影響對(duì)圖像的感知。

圖4顯示了相同底層圖像的隨機(jī)實(shí)現(xiàn),這些圖像是使用具有不同噪聲實(shí)現(xiàn)的生成器生成的。

圖4

可以看到,噪聲只影響隨機(jī)屬性,使整體組成和身份等高級(jí)屬性保持不變。

圖5進(jìn)一步說(shuō)明了將隨機(jī)變化應(yīng)用于不同子層的效果。

圖5

整體效應(yīng)與隨機(jī)性的分離

在基于樣式的生成器中,樣式會(huì)影響整個(gè)圖像,因?yàn)橥暾奶卣鲌D像會(huì)被縮放并帶有相同的值。

因此,可以相干地控制姿態(tài)、燈光或背景風(fēng)格等全局效果。同時(shí),噪聲被獨(dú)立地添加到每個(gè)像素上,因此非常適合于控制隨機(jī)變化。

如果網(wǎng)絡(luò)試圖控制例如使用噪聲的擺姿,這將導(dǎo)致空間不一致的決定,然后將受到鑒別器的“懲罰”。因此,網(wǎng)絡(luò)學(xué)會(huì)了在沒(méi)有明確指導(dǎo)的情況下,適當(dāng)?shù)厥褂萌趾捅镜赝ǖ?channel)。

兩種自動(dòng)化方法,任何生成器都能升級(jí)

為了量化插值質(zhì)量和分離,英偉達(dá)提出了兩種新的自動(dòng)化方法,適用于任何生成器體系架構(gòu)。

研究人員還發(fā)布了一個(gè)新的面部圖像數(shù)據(jù)集:數(shù)據(jù)收集自Flickr上的7萬(wàn)張面部圖像,數(shù)據(jù)已經(jīng)對(duì)齊和裁剪。研究人員使用亞馬遜Mechanical Turk來(lái)清除雕像、繪畫(huà)和其他異常圖像。

鑒于目前此類項(xiàng)目所使用的標(biāo)準(zhǔn)數(shù)據(jù)集主要是名人走紅毯的照片,本數(shù)據(jù)集應(yīng)該能夠提供變化更豐富的面部圖像組合。

這些數(shù)據(jù)集不久后即將開(kāi)放下載。

GAN 2.0已經(jīng)如此,GAN 3.0將會(huì)如何?

使用基于風(fēng)格的生成器的GAN,在各個(gè)方面都優(yōu)于傳統(tǒng)的GAN,可以說(shuō)是 GAN 2.0。

英偉達(dá)團(tuán)隊(duì)相信,對(duì)高階屬性與隨機(jī)效應(yīng)分離的研究,以及中間隱空間(intermediate latent space)的線性,將會(huì)對(duì)提高GAN合成的理解和可控性有很大的幫助。

可以注意到,平均路徑長(zhǎng)度度量可以很容易地用作訓(xùn)練中的正則化器,也許線性可分度量的某些變體也可以作為一個(gè)正則化器。

除了人像,GAN 2.0還可以生成房間、汽車等各種場(chǎng)景。有了這個(gè)利器,以后何愁圖像數(shù)據(jù)集?

看著這些計(jì)算機(jī)生成的“人”,是如此的真實(shí)但又虛擬。愛(ài)上一個(gè)不存在的人,似乎完全合情合理。

總的來(lái)說(shuō),在訓(xùn)練期間直接塑造中間隱空間(intermediate latent space)的方法將為未來(lái)的工作提供有趣的途徑。

所以,期待一下全新的判別器架構(gòu),屆時(shí)得到的GAN 3.0,會(huì)如何沖擊我們的視覺(jué)和認(rèn)知呢?

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • GaN
    GaN
    +關(guān)注

    關(guān)注

    21

    文章

    2388

    瀏覽量

    84749
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4119

    瀏覽量

    99684

原文標(biāo)題:GAN 2.0!英偉達(dá)“風(fēng)格遷移”面部生成器,世間萬(wàn)物逼真呈現(xiàn)

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    探索 SN54LS181、SN54S181、SN74LS181 和 SN74S181 算術(shù)邏輯單元/函數(shù)生成器

    探索 SN54LS181、SN54S181、SN74LS181 和 SN74S181 算術(shù)邏輯單元/函數(shù)生成器 在電子工程師的日常設(shè)計(jì)工作中,選擇合適的芯片是實(shí)現(xiàn)高效、可靠電路的關(guān)鍵。今天,我們就來(lái)
    的頭像 發(fā)表于 04-22 16:40 ?357次閱讀

    ICS2008B:SMPTE時(shí)間碼接收器/生成器的技術(shù)解析

    ICS2008B:SMPTE時(shí)間碼接收器/生成器的技術(shù)解析 在多媒體技術(shù)飛速發(fā)展的今天,時(shí)間碼的精確控制對(duì)于音視頻同步至關(guān)重要。ICS2008B作為一款SMPTE時(shí)間碼接收器/生成器芯片,為多媒體
    的頭像 發(fā)表于 04-13 18:10 ?423次閱讀

    探索ICS9FG104E:PCIe Gen1/2、USB3.0等設(shè)備的頻率生成器解決方案

    探索ICS9FG104E:PCIe Gen1/2、USB3.0等設(shè)備的頻率生成器解決方案 在電子設(shè)備的設(shè)計(jì)中,頻率生成器扮演著至關(guān)重要的角色,它為各種高速接口提供穩(wěn)定的時(shí)鐘信號(hào),確保設(shè)備的正常運(yùn)行
    的頭像 發(fā)表于 03-29 17:05 ?938次閱讀

    2026年第一季度恩智浦新品大盤(pán)點(diǎn)

    新年伊始,馬力全開(kāi)!2026年開(kāi)年,恩智浦推“芯”勢(shì)頭強(qiáng)勁,既有新銳產(chǎn)品的橫空出世,也有成熟平臺(tái)的穩(wěn)步擴(kuò)展,覆蓋從機(jī)器人到軟件定義汽車等前沿領(lǐng)域,助力開(kāi)發(fā)者解鎖智能邊緣的無(wú)限可能!
    的頭像 發(fā)表于 03-28 10:16 ?1350次閱讀

    SBC案例生成器對(duì)VisionFive2的支持

    最近收到了我的 VisionFive2,并且是 SBC 模型框架和 SBC 案例生成器的開(kāi)發(fā)人員,我為那些對(duì)標(biāo)準(zhǔn)和自定義案例感興趣的人在這兩個(gè)應(yīng)用程序中添加了對(duì) VisionFive2 SBC
    發(fā)表于 03-18 08:21

    探索Renesas 9FGV0431:低功耗PCIe時(shí)鐘生成器的卓越之選

    探索Renesas 9FGV0431:低功耗PCIe時(shí)鐘生成器的卓越之選 引言 在當(dāng)今的電子設(shè)計(jì)領(lǐng)域,PCIe技術(shù)的廣泛應(yīng)用對(duì)時(shí)鐘生成器提出了更高的要求。Renesas的9FGV0431作為一款專為
    的頭像 發(fā)表于 03-15 17:25 ?1198次閱讀

    蘋(píng)果聯(lián)姻博通,"Baltra"橫空出世英偉達(dá)霸主地位將變?

    通展開(kāi)戰(zhàn)略合作。 ? 美國(guó)金融數(shù)據(jù)分析平臺(tái)unusual whales在社交平臺(tái)X上指出,蘋(píng)果公司此舉有意擺脫英偉達(dá)的高額利潤(rùn)。這一動(dòng)作標(biāo)志著蘋(píng)果正試圖通過(guò)垂直整合構(gòu)建自主可控的AI算力生態(tài),未來(lái)或?qū)?duì)AI芯片生態(tài)帶來(lái)深遠(yuǎn)影響。 ? ? ? 聯(lián)手博通研發(fā)“
    的頭像 發(fā)表于 12-20 07:43 ?1.1w次閱讀
    蘋(píng)果聯(lián)姻博通,&quot;Baltra&quot;<b class='flag-5'>橫空出世</b>!<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>霸主地位將變?

    把CW32L010用FLASH模擬EEPROM

    CW32L010橫空出世,定時(shí)器和ADC變化很大,F(xiàn)LASH基本和以前型號(hào)一樣,但有一點(diǎn)改動(dòng),BUSY位從CR1寄存器改到ISR寄存器了。 把F003的程序改改就能用,太棒了,拿走不謝。 只有一個(gè)
    發(fā)表于 11-24 07:40

    冶金車間“迷霧”重重?耐達(dá)訊自動(dòng)化Profibus轉(zhuǎn)光纖為HMI點(diǎn)亮“透視眼”!

    “隔山打?!?。難道智能控制只能被銅纜的“物理枷鎖”拖累?答案當(dāng)然是否定的!耐達(dá)訊自動(dòng)化Profibus轉(zhuǎn)光纖技術(shù)橫空出世,為HMI裝上“透視眼”,讓操作指令穿透車間“迷霧”,直達(dá)設(shè)備核心! 二、直擊冶金痛點(diǎn):破除“通信迷霧”,點(diǎn)亮透明生
    的頭像 發(fā)表于 11-10 14:49 ?1266次閱讀
    冶金車間“迷霧”重重?耐<b class='flag-5'>達(dá)</b>訊自動(dòng)化Profibus轉(zhuǎn)光纖為HMI點(diǎn)亮“透視眼”!

    NVIDIA新聞:英偉達(dá)10億美元入股諾基亞 英偉達(dá)推出全新量子設(shè)備

    研發(fā)并推出相關(guān)產(chǎn)品。 英偉達(dá)CEO黃仁勛出現(xiàn)在美國(guó)華盛頓的GTC DC大會(huì)上的演講中表示;“今天我們宣布與諾基亞建立了合作關(guān)系,諾基亞是世界第二大電信制造商,這是一個(gè)價(jià)值3萬(wàn)億美元的產(chǎn)業(yè)?!秉S仁勛說(shuō),全世界有數(shù)百萬(wàn)個(gè)基站,雙方合
    的頭像 發(fā)表于 10-29 17:12 ?2507次閱讀

    如何通過(guò)地址生成器實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)特征圖的padding?

    一些內(nèi)存(BRAM),但是考慮到我們?cè)O(shè)計(jì)的網(wǎng)絡(luò)為五層卷積池化結(jié)構(gòu),特征圖BRAM在每層卷積結(jié)束之后都進(jìn)行存儲(chǔ)的復(fù)用,因此其大小取決于最大特征圖大小,因此使用稀疏地址生成器并不能大量減少存儲(chǔ)資源消耗
    發(fā)表于 10-22 08:15

    工程師怒贊:耐達(dá)訊網(wǎng)關(guān)讓Modbus設(shè)備‘?dāng)D進(jìn)’Profinet圈,觸摸屏效率翻倍!\"

    Profinet網(wǎng)關(guān)橫空出世,這場(chǎng)“協(xié)議戰(zhàn)爭(zhēng)”終于有了終結(jié)者! 某光伏廠的工程師曾被一個(gè)問(wèn)題折磨到抓狂:Modbus電流傳感器的數(shù)據(jù)像“加密文件”,無(wú)法被Profinet PLC直接讀取,導(dǎo)致產(chǎn)能分析
    發(fā)表于 07-29 15:02

    東芝24TB超大容量CMR硬盤(pán)評(píng)測(cè)

    大模型的橫空出世不僅改變了計(jì)算行業(yè),也深刻影響了存儲(chǔ)行業(yè)。
    的頭像 發(fā)表于 07-10 09:46 ?2864次閱讀
    東芝24TB超大容量CMR硬盤(pán)評(píng)測(cè)

    華為Pura80 Ultra“一鏡雙目長(zhǎng)焦”橫空出世,手機(jī)影像格局要變天?

    的影像升級(jí),Pura80 Ultra以1英寸超高動(dòng)態(tài)主攝、一鏡雙目長(zhǎng)焦、AI輔助構(gòu)圖等突破性創(chuàng)新,重新定義了“影像旗艦”的新內(nèi)涵。 圖:華為余承東展示Pura80 Ultra新機(jī) “2024年4月推出的Pura70系列,上市一年來(lái)獲得了千萬(wàn)用戶的喜愛(ài)。今年3月份,華為推出
    的頭像 發(fā)表于 06-12 09:12 ?1.2w次閱讀
    華為Pura80 Ultra“一鏡雙目長(zhǎng)焦”<b class='flag-5'>橫空出世</b>,手機(jī)影像格局要變天?
    威远县| 东港市| 宜丰县| 正蓝旗| 杭锦后旗| 梨树县| 佛教| 北碚区| 武宁县| 正蓝旗| 突泉县| 河间市| 宜君县| 阳新县| 汉川市| 宝兴县| 东港市| 成都市| 阿巴嘎旗| 湖南省| 中卫市| 河曲县| 新巴尔虎右旗| 西盟| 岳阳县| 石狮市| 新余市| 徐州市| 兴隆县| 石家庄市| 英吉沙县| 临夏市| 龙川县| 阿城市| 新和县| 石首市| 清涧县| 额尔古纳市| 台中市| 长丰县| 西贡区|