日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

不會(huì)PS還想做圖?微軟、京東出黑科技:說(shuō)一句話(huà)就能生成圖片!

DPVg_AI_era ? 來(lái)源:YXQ ? 2019-06-24 14:02 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟和京東最近出了一個(gè)黑科技:說(shuō)一句話(huà)就能生成圖片!在這項(xiàng)研究中,研究人員提出了一種新的機(jī)器學(xué)習(xí)框架——ObjGAN,可以通過(guò)關(guān)注文本描述中最相關(guān)的單詞和預(yù)先生成的語(yǔ)義布局(semantic layout)來(lái)合成顯著對(duì)象。

不會(huì)PS還想做圖?可以的!

近期,由紐約州立大學(xué)奧爾巴尼分校、微軟研究院和京東AI研究院合作的一篇文章就可以實(shí)現(xiàn)這個(gè)需求:只需要輸入一句話(huà),就可以生成圖片!

輸入:

輸出:

在這項(xiàng)研究中,研究人員提出了一種新的機(jī)器學(xué)習(xí)框架——ObjGAN,可以通過(guò)關(guān)注文本描述中最相關(guān)的單詞和預(yù)先生成的語(yǔ)義布局(semantic layout)來(lái)合成顯著對(duì)象。

此外,他們還提出了一種新的基于Fast R-CNN的關(guān)于對(duì)象(object-wise)鑒別器,用來(lái)提供關(guān)于合成對(duì)象是否與文本描述和預(yù)先生成的布局匹配的對(duì)象識(shí)別信號(hào)。

論文地址:

https://www.microsoft.com/en-us/research/uploads/prod/2019/06/1902.10740.pdf

這項(xiàng)工作已經(jīng)發(fā)表在計(jì)算機(jī)視覺(jué)和模式識(shí)別領(lǐng)域頂會(huì)CVPR 2019。

這篇論文的合著作者表示,與之前最先進(jìn)的技術(shù)相比,他們的方法大大提高了圖像質(zhì)量:

我們的生成器能夠利用細(xì)粒度的單詞和對(duì)象級(jí)(object-level)信息逐步細(xì)化合成圖像。

大量的實(shí)驗(yàn)證明了ObjGAN在復(fù)雜場(chǎng)景的文本到圖像生成方面的有效性和泛化能力。

一句話(huà)秒生成圖片!

根據(jù)文本的描述來(lái)生成圖像,可以說(shuō)是機(jī)器學(xué)習(xí)中一項(xiàng)非常重要的任務(wù)。

這項(xiàng)任務(wù)需要處理自然語(yǔ)言描述中模糊和不完整的信息,并且還需要跨視覺(jué)和語(yǔ)言模式來(lái)進(jìn)行學(xué)習(xí)。

自從GAN提出后,這項(xiàng)任務(wù)在結(jié)果上取得了較好的成績(jī),但是目前這些基于GAN的方法有一個(gè)缺點(diǎn):

大多數(shù)圖像合成方法都是基于全局句子向量來(lái)合成圖像,而全局句子向量可能會(huì)丟失單詞級(jí)別(word-level)的重要細(xì)粒度信息,從而阻礙高質(zhì)量圖像的生成。

大多數(shù)方法都沒(méi)有在圖像中明確地建模對(duì)象及其關(guān)系,因此難以生成復(fù)雜的場(chǎng)景。

圖1 頂部:AttnGAN及其網(wǎng)格注意力可視化;中部:修改前人工作的結(jié)果;底部:ObjGAN及其對(duì)象驅(qū)動(dòng)的注意力可視化

舉個(gè)例子,如果要根據(jù)“幾個(gè)人穿滑雪服的人在雪地里”這句話(huà)生成一張圖片,那么需要對(duì)不同的對(duì)象(人、滑雪服)及其交互(穿滑雪服的人)進(jìn)行建模,還需要填充缺失的信息(例如背景中的巖石)。

圖1的第一行是由AttnGAN生成的圖像,雖然圖像中包含了人和雪的紋理,但是人的形狀是扭曲的,圖像布局在語(yǔ)義上是沒(méi)有意義的。

為了解決這個(gè)問(wèn)題,首先從文本構(gòu)造語(yǔ)義布局,然后通過(guò)反卷積圖像生成器合成圖像。

從圖1的中間一行可知,雖然細(xì)粒度的word/objectlevel信息仍然沒(méi)有很好的用于生成。因此,合成的圖像沒(méi)有包含足夠的細(xì)節(jié)讓它們看起來(lái)更加真實(shí)。

本研究的目標(biāo)就是生成具有語(yǔ)義意義(semantically meaningful)的布局和現(xiàn)實(shí)對(duì)象的高質(zhì)量復(fù)雜圖像。

為此,研究人員提出了一種新穎的對(duì)象驅(qū)動(dòng)的注意力生成對(duì)抗網(wǎng)絡(luò)(Object-driven Attentive Generative Adversarial Networks,Obj-GAN),該網(wǎng)絡(luò)能夠有效地捕獲和利用細(xì)粒度的word/objectlevel信息進(jìn)行文本到圖像的合成。

ObjGAN由一對(duì)兒對(duì)象驅(qū)動(dòng)的注意力圖像生成器和object-wise判別器組成,并采用了一種新的對(duì)象驅(qū)動(dòng)注意機(jī)制。

圖2 對(duì)象驅(qū)動(dòng)的注意力圖像生成器

圖3 Object-wise判別器

該圖像生成器以文本描述和預(yù)先生成的語(yǔ)義布局為輸入,通過(guò)多階段由粗到精的過(guò)程合成高分辨率圖像。

在每個(gè)階段,生成器通過(guò)關(guān)注與該邊界框中的對(duì)象最相關(guān)的單詞來(lái)合成邊界框內(nèi)的圖像區(qū)域,如圖1的底部行所示。

更具體地說(shuō),它使用一個(gè)新的對(duì)象驅(qū)動(dòng)的注意層,使用類(lèi)標(biāo)簽查詢(xún)句子中的單詞,形成一個(gè)單詞上下文向量,如圖4所示,然后根據(jù)類(lèi)標(biāo)簽和單詞上下文向量條件合成圖像區(qū)域。

圖4 對(duì)象驅(qū)動(dòng)的注意力

Object-wise判別器會(huì)對(duì)每個(gè)邊界框進(jìn)行檢查,確保生成的對(duì)象確實(shí)與預(yù)先生成的語(yǔ)義布局是匹配的。

同時(shí),為了有效地計(jì)算所有邊界框的識(shí)別損失,object-wise判別器基于一個(gè)Fast-RNN,并且每個(gè)邊界框都有一個(gè)二院交叉熵?fù)p失。

實(shí)驗(yàn)結(jié)果

研究人員在實(shí)驗(yàn)過(guò)程中采用的數(shù)據(jù)集是COCO數(shù)據(jù)集。它包含80個(gè)對(duì)象類(lèi),其中每個(gè)圖像與對(duì)象注釋?zhuān)?,邊界框和形狀)?個(gè)文本描述相關(guān)聯(lián)。

在評(píng)價(jià)指標(biāo)方面,研究人員采用 Inception score(IS)和Frechet Inception distance(FID) score作為定量評(píng)價(jià)指標(biāo)。結(jié)果如下表所示:

表1

接下來(lái),是采用不同方法生成圖像的結(jié)果與實(shí)際圖像的對(duì)比結(jié)果:

圖5 整體定性比較。所有圖像都是在不使用任何ground-truth的情況下生成的。

圖6 與P-AttnGAN w/ Lyt進(jìn)行定性比較

圖7 與P-AttnGAN的定性比較。 每個(gè)方法的注意力圖顯示在生成的圖像旁邊。


聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6759

    瀏覽量

    108125
  • 京東方
    +關(guān)注

    關(guān)注

    25

    文章

    1631

    瀏覽量

    62682

原文標(biāo)題:CVPR 2019:微軟最新提出ObjGAN,輸入一句話(huà)秒生成圖片

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    功率因數(shù)正負(fù)啥意思?老電工一句話(huà)講明白

    功率因數(shù)正負(fù)反映無(wú)功性質(zhì),正為感性滯后,負(fù)為容性超前,現(xiàn)場(chǎng)判斷需看無(wú)功補(bǔ)償狀態(tài)。
    的頭像 發(fā)表于 05-01 21:18 ?167次閱讀
    功率因數(shù)正負(fù)啥意思?老電工<b class='flag-5'>一句話(huà)</b>講明白

    功率因數(shù)半夜亂跳?老電工一句話(huà)給你講明白

    夜間空載功率因數(shù)波動(dòng)屬正?,F(xiàn)象,不耗電、不傷設(shè)備,勿驚慌。
    的頭像 發(fā)表于 04-27 18:55 ?240次閱讀
    功率因數(shù)半夜亂跳?老電工<b class='flag-5'>一句話(huà)</b>給你講明白

    ??翟祈鳦law正式亮相

    4月24日,在??翟祈啥加脩?hù)沙龍上,??翟祈鳦law正式亮相!只需一句話(huà),就能讓它完成巡查、問(wèn)題識(shí)別、整改推送、復(fù)盤(pán)的全鏈路閉環(huán),還能精準(zhǔn)適配不同崗位需求。
    的頭像 發(fā)表于 04-27 17:06 ?993次閱讀

    告別手忙腳亂!蜀瑞創(chuàng)新語(yǔ)音鍵順控,一句話(huà)搞定開(kāi)關(guān)柜

    語(yǔ)音鍵順控,不是簡(jiǎn)單加個(gè)語(yǔ)音功能,而是可視化 + 語(yǔ)音 + 五防 + 自動(dòng)順控的體化升級(jí) —— 讓開(kāi)關(guān)柜 “聽(tīng)得懂、做得準(zhǔn)、看得見(jiàn)”,把電力運(yùn)維從 “繁瑣人工” 推向 “智能語(yǔ)音” 時(shí)代。一句話(huà),搞定倒閘;
    的頭像 發(fā)表于 04-24 09:16 ?331次閱讀
    告別手忙腳亂!蜀瑞創(chuàng)新語(yǔ)音<b class='flag-5'>一</b>鍵順控,<b class='flag-5'>一句話(huà)</b>搞定開(kāi)關(guān)柜

    簡(jiǎn)單認(rèn)識(shí)安信可VC系列離線(xiàn)語(yǔ)音識(shí)別模組

    VC系列是安信可基于云知聲US516P6芯片推出的離線(xiàn)語(yǔ)音識(shí)別模組,支持中英文雙語(yǔ)、150條指令詞、98%識(shí)別率、100ms響應(yīng)。不需聯(lián)網(wǎng)、不需云端調(diào)用、個(gè)模組搞定本地語(yǔ)音控制,特別適合IoT設(shè)備、智能家居、工業(yè)控制場(chǎng)景。如果你做的產(chǎn)品需要"說(shuō)
    的頭像 發(fā)表于 04-14 17:02 ?1131次閱讀

    一句話(huà)讓大模型控制硬件:手把手教你給 EmbedClaw 添加自己的 Tool!

    很多人第次看到EmbedClaw會(huì)有種錯(cuò)覺(jué):然而事實(shí)是:不能直接操作,但可以通過(guò)Tool去操作。這也是EmbedClaw很有意思的點(diǎn)。它不是把大模型硬塞進(jìn)ESP32里當(dāng)聊天機(jī)器人,而是把LLM
    的頭像 發(fā)表于 04-01 18:32 ?198次閱讀
    <b class='flag-5'>一句話(huà)</b>讓大模型控制硬件:手把手教你給 EmbedClaw 添加自己的 Tool!

    逆天了!把OpenClaw裝入ESP32-S3上是種什么體驗(yàn)

    最近小龍蝦OpenClaw實(shí)在是太火了,相信你或多或少都刷到過(guò)。如果一句話(huà)解釋什么是OpenClaw:款可以運(yùn)行在任何系統(tǒng)上的A
    的頭像 發(fā)表于 03-22 10:05 ?1143次閱讀
    逆天了!把OpenClaw裝入ESP32-S3上是<b class='flag-5'>一</b>種什么體驗(yàn)

    小藝開(kāi)放平臺(tái)鴻蒙智能體開(kāi)發(fā)智能體配置-基礎(chǔ)信息

    創(chuàng)建智能體后,開(kāi)發(fā)者可以進(jìn)入智能體配置頁(yè)面對(duì)智能體基礎(chǔ)信息進(jìn)行編輯。支持編輯智能體圖標(biāo)、智能體名稱(chēng)、智能體一句話(huà)描述、智能體支持的設(shè)備和系統(tǒng)、創(chuàng)建者昵稱(chēng)、智能體分類(lèi)、智能體別名、AgentCard
    發(fā)表于 02-02 16:47

    EMMI-InGaAs 與 OBIRCH:分鐘教你看懂兩款失效定位設(shè)備原理與應(yīng)用

    一句話(huà)區(qū)別總結(jié) EMMI 看光 → 漏電、擊穿這類(lèi)“會(huì)發(fā)光的異常” OBIRCH 看熱 → 金屬短路、高阻這類(lèi)“無(wú)光但致命的問(wèn)題”
    的頭像 發(fā)表于 12-05 16:21 ?1481次閱讀
    EMMI-InGaAs 與 OBIRCH:<b class='flag-5'>一</b>分鐘教你看懂兩款失效定位設(shè)備原理與應(yīng)用

    一句話(huà),多個(gè)命令同時(shí)執(zhí)行,AI語(yǔ)音模組也能多任務(wù)處理?

    、 Ai-WV02-32S ? 將語(yǔ)音識(shí)別、喚醒、語(yǔ)義理解等核心功能, 濃縮在顆小小的模組中。 安信可AI語(yǔ)音模組支持 MCP 協(xié)議(Multi Command Processing,多命令并行處理) ,讓語(yǔ)音交互從“單線(xiàn)程”進(jìn)化為真正的“多任務(wù)協(xié)同”! 一句話(huà)喚醒“
    的頭像 發(fā)表于 10-31 14:45 ?729次閱讀
    <b class='flag-5'>一句話(huà)</b>,多個(gè)命令同時(shí)執(zhí)行,AI語(yǔ)音模組也能多任務(wù)處理?

    真正免費(fèi)的AI生成PPT工具盤(pán)點(diǎn):告別收費(fèi)陷阱

    的戰(zhàn)斗機(jī)",其他9款工具也各有絕活,保證讓你告別收費(fèi)陷阱,輕松做出專(zhuān)業(yè)級(jí)PPT! 、AiPPT:一句話(huà)生成PPT的"時(shí)間管理大師" 一句話(huà)生成
    的頭像 發(fā)表于 10-30 15:43 ?7025次閱讀
    真正免費(fèi)的AI<b class='flag-5'>生成</b>PPT工具盤(pán)點(diǎn):告別收費(fèi)陷阱

    智多晶SA5T-200 FPGA開(kāi)發(fā)板重磅發(fā)布

    在科技飛速發(fā)展的今天,硬件與軟件的融合正不斷重塑我們的世界。而在芯片領(lǐng)域,流傳著這樣一句話(huà):“軟件定義世界,F(xiàn)PGA定義未來(lái)”。
    的頭像 發(fā)表于 10-11 11:45 ?1234次閱讀

    一句話(huà)了解21種計(jì)算模式

    、智能化趨勢(shì)、安全與可持續(xù)四個(gè)維度,梳理了21種計(jì)算模式,并盡量用通俗易懂的一句話(huà)向您介紹每種模式的定義。架構(gòu)與資源維度并行計(jì)算:把大任務(wù)拆成多個(gè)小任務(wù),讓多顆處理器
    的頭像 發(fā)表于 08-06 14:31 ?892次閱讀
    <b class='flag-5'>一句話(huà)</b>了解21種計(jì)算模式

    2025 AI主戰(zhàn)場(chǎng),連鎖門(mén)店“變形記”

    讓業(yè)務(wù)駕馭AI,當(dāng)大模型的價(jià)值通過(guò)“取漢堡更快”“一句話(huà)點(diǎn)咖啡”來(lái)實(shí)現(xiàn),這場(chǎng)技術(shù)變革才算真正落地
    的頭像 發(fā)表于 07-24 12:41 ?1430次閱讀
    2025 AI主戰(zhàn)場(chǎng),連鎖門(mén)店“變形記”

    一句話(huà)PPT“的榮耀YOYO,AI生產(chǎn)力有多強(qiáng)?

    釋放AI生產(chǎn)力,榮耀讓智能體告別發(fā)布會(huì)炫技
    的頭像 發(fā)表于 07-14 14:15 ?2868次閱讀
    “<b class='flag-5'>一句話(huà)</b>秒<b class='flag-5'>出</b>PPT“的榮耀YOYO,AI生產(chǎn)力有多強(qiáng)?
    两当县| 佛学| 南充市| 望都县| 浦江县| 清涧县| 林州市| 胶南市| 甘孜| 德州市| 临沧市| 方山县| 盐池县| 安义县| 远安县| 托里县| 雷山县| 六盘水市| 邵武市| 乾安县| 随州市| 海南省| 鄱阳县| 青冈县| 谢通门县| 普安县| 隆昌县| 安泽县| 安多县| 仙居县| 潞西市| 宣恩县| 华蓥市| 甘泉县| 通化市| 通许县| 景洪市| 潢川县| 四会市| 当涂县| 台南市|