日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

清華、GoogleAI和斯李飛飛團(tuán)隊(duì)提出具有強(qiáng)記憶力的E3D-LSTM網(wǎng)絡(luò)

G5zW_AppDowns ? 來源:陳年麗 ? 2019-08-27 10:39 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

清華大學(xué)、Google AI 和斯坦福大學(xué)李飛飛團(tuán)隊(duì)提出了一種具有強(qiáng)記憶力的 E3D-LSTM 網(wǎng)絡(luò),強(qiáng)化了 LSTM 的長時記憶能力,這為視頻預(yù)測、動作分類等相關(guān)問題提供了新思路,是一項(xiàng)非常具有啟發(fā)性的工作。

如何對時間序列進(jìn)行時空建模及特征抽取,是 RGB 視頻預(yù)測分類,動作識別,姿態(tài)估計等相關(guān)領(lǐng)域的研究熱點(diǎn)。

清華大學(xué)、Google AI 和斯坦福大學(xué)李飛飛團(tuán)隊(duì)提出了一種具有強(qiáng)記憶力的 E3D-LSTM 網(wǎng)絡(luò),用 3D 卷積代替 2D 卷積作為 LSTM 網(wǎng)絡(luò)的基礎(chǔ)計算操作,并加入自注意力機(jī)制,使網(wǎng)絡(luò)能同時兼顧長時和短時信息依賴以及局部時空特征抽取。

這為視頻預(yù)測、動作分類等相關(guān)問題提供了新思路,是一項(xiàng)非常具有啟發(fā)性的工作。

時間序列的時空建模問題

現(xiàn)實(shí)生活中許多數(shù)據(jù)都同時具有時間特征和空間特征,例如人體的運(yùn)動軌跡,連續(xù)幀的視頻等,每個時間點(diǎn)都對應(yīng)一組數(shù)據(jù),而數(shù)據(jù)往往又具有一定的空間特征。因此要在這樣的時間序列數(shù)據(jù)上開展分類,預(yù)測等工作,就必須在時間(temporal)和空間 (spatial) 上對其進(jìn)行建模和特征抽取。

常用的時間建模工具是循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)相關(guān)模型(LSTM 等),由于其特有的門結(jié)構(gòu)設(shè)計,對時間序列特征具有強(qiáng)大的抽取能力,因此被廣泛應(yīng)用于預(yù)測問題并取得了良好的成果,但是 RNN 并不能很好的學(xué)習(xí)到原始特征的高階表示,這不利于對空間信息的提取??臻g建模則當(dāng)屬卷積神經(jīng)網(wǎng)絡(luò)(CNN),其具有強(qiáng)大的空間特征抽取能力,其中3D-CNN又能將卷積核可控范圍擴(kuò)大到時域上,相對于 2D 卷積靈活性更高,能學(xué)習(xí)到更多的運(yùn)動信息(motion 信息),相對于 RNN 則更有利于學(xué)習(xí)到信息的高級表示(層數(shù)越深,信息越高級),是目前動作識別領(lǐng)域的流行方法。當(dāng)然 3D 卷積的時間特征抽取能力并不能和 RNN 媲美。

得益于 3D 卷積和 RNN 在各自領(lǐng)域的成功,如何進(jìn)一步將二者結(jié)合起來使用也成為了研究熱點(diǎn),常見的簡單方法是將二者串聯(lián)堆疊或者并聯(lián)結(jié)合(在圖卷積網(wǎng)絡(luò)出現(xiàn)之前,動作識別領(lǐng)域的最優(yōu)方法就是將 CNN 和 RNN 并聯(lián)),但測試發(fā)現(xiàn)這么做并不能帶來太大的提升,這是因?yàn)槎叩墓ぷ鳈C(jī)制差距太大,簡單的結(jié)合并不能很好的實(shí)現(xiàn)優(yōu)勢互補(bǔ)。本文提出用 3D 卷積代替原始 LSTM 中的門更新操作,使 LSTM 不僅能在時間層面,也能在空間層面上進(jìn)行短期依賴的表象特征和運(yùn)動特征的抽取,從而在更深的機(jī)制層面實(shí)現(xiàn)兩種網(wǎng)絡(luò)的結(jié)合。此外,在 LSTM 中引入自注意力(self-attention)機(jī)制,進(jìn)一步強(qiáng)化了 LSTM 的長時記憶能力,使其對長距離信息作用具有更好的感知力。作者將這種網(wǎng)絡(luò)稱為Eidetic 3D LSTM(E3D-LSTM),Eidetic 意思是具有逼真記憶,強(qiáng)調(diào)網(wǎng)絡(luò)的強(qiáng)記憶能力。

E3D-LSTM 網(wǎng)絡(luò)結(jié)構(gòu)

圖 1:三種不同的 3D 卷積和 LSTM 的結(jié)合方法

圖中每個顏色的模塊都代表了多層相應(yīng)的網(wǎng)絡(luò)。圖(a)和圖(b)是兩種 3D 卷積和 LSTM 結(jié)合的基線方法,3D 卷積和 LSTM 線性疊加,主要起到了編碼(解碼器)的作用,并沒有和 RNN 有機(jī)制上的結(jié)合。圖(a)中 3D 卷積作為編碼器,輸入是一段視頻幀,圖(b)中作為解碼器,得到每個單元的最終輸出。這兩個方法中的綠色模塊使用的是時空長短時記憶網(wǎng)絡(luò)(ST-LSTM)[1],這種 LSTM 獨(dú)立的維護(hù)兩個記憶狀態(tài) M 和 C,但由于記憶狀態(tài) C 的遺忘門過于響應(yīng)具有短期依賴的特征,因此容易忽略長時依賴信息,因此 E3D-LSTM 在 ST-LSTM 的基礎(chǔ)添加了自注意力機(jī)制和 3D 卷積操作,在一定程度上解決了這個問題。具體單元結(jié)構(gòu)下一節(jié)介紹。

圖(c)是 E3D-LSTM 網(wǎng)絡(luò)的結(jié)構(gòu),3D 卷積作為編碼 - 解碼器(藍(lán)色模塊),同時和 LSTM 結(jié)合(橙色模塊)。E3D-LSTM 既可用于分類任務(wù),也可用于預(yù)測任務(wù)。分類時將所有 LSTM 單元的輸出結(jié)合,預(yù)測時則利用 3D 卷積解碼器的輸出作為預(yù)測值。

E3D-LSTM 單元結(jié)構(gòu)設(shè)計

圖 2:標(biāo)準(zhǔn) LSTM 單元結(jié)構(gòu)

首先簡要介紹一下標(biāo)準(zhǔn) LSTM 結(jié)構(gòu),和 RNN 相比 LSTM 增加了更復(fù)雜的門結(jié)構(gòu)(圖中黃色模塊),主要解決 RNN 中存在的梯度消失問題,從而提高網(wǎng)絡(luò)對長時依賴(long-term dependency)的記憶感知能力。LSTM 有兩個輸入門,一個輸出門和遺忘門

。

圖 2:ST-LSTM 網(wǎng)絡(luò)結(jié)構(gòu)和單元結(jié)構(gòu)

和標(biāo)準(zhǔn) LSTM 相比,ST-LSTM 還增加了不同層間對應(yīng)位置的 cell 連接,如圖 2 左側(cè),水平灰色連接線表示標(biāo)準(zhǔn) LSTM 的單元連接,豎直黃色連接線表示層間同一時刻的單元連接,通過張量 M 傳播,注意當(dāng) l=1 時,

(作者認(rèn)為 t 時刻的頂層信息對 t+1 時刻的底層信息影響很大),這樣記憶信息就能同時在層內(nèi)和層間傳播。

圖 3 E3D-LSTM 單元結(jié)構(gòu)

圖 3 是本文提出的 E3D-LSTM 模型的單元結(jié)構(gòu),

是一個維度為的五維張量,代表之前個時間步的所有隱狀態(tài)。表示召回門(代替遺忘門),和 ST-LSTM 相比,主要有以下改進(jìn):

1、輸入數(shù)據(jù)是的四維張量,對應(yīng)時刻

的連續(xù)幀序列,因此現(xiàn)在每個單元時間步都對應(yīng)一段視頻,而不是單幀視頻。

2、針對幀序列數(shù)據(jù)額外添加了一個召回門(recall gate)以及相關(guān)結(jié)構(gòu),用于實(shí)現(xiàn)長時依賴學(xué)習(xí),也就是自注意力機(jī)制。這部分對應(yīng)網(wǎng)絡(luò)名稱中的 Eidetic。

3、由于輸入數(shù)據(jù)變成了四維張量,因此在更新公式中采用 3D 卷積操作而不是 2D 卷積。

大部分門結(jié)構(gòu)的更新公式和 ST-LSTM 相同,額外添加了召回門更新公式:

上面介紹的機(jī)制用于同一層不同時間步連接,作者將這種機(jī)制也用在了不同層同一時間步的連接,但效果并不好,這是因?yàn)椴煌瑢釉谕粫r刻學(xué)習(xí)到的信息并沒有太好的依賴性。

基于 E3D-LSTM 的半監(jiān)督輔助學(xué)習(xí)

在許多監(jiān)督學(xué)習(xí)任務(wù),例如視頻動作識別中,沒有足夠的監(jiān)督信息和標(biāo)注信息來幫助訓(xùn)練一個令人滿意的 RNN,因此可以將視頻預(yù)測作為一個輔助的表征學(xué)習(xí)方法,來幫助網(wǎng)絡(luò)更好的理解視頻特征,并提高時間域上的監(jiān)督性。

具體的,讓視頻預(yù)測和動作識別任務(wù)共享相同的主干網(wǎng)絡(luò)(圖 1),只不過損失函數(shù)不同,在視頻預(yù)測任務(wù)中,目標(biāo)函數(shù)為:

帶上標(biāo)的 X 表示預(yù)測值,不帶上標(biāo)的表示真值,F(xiàn) 表示 Frobenius 歸一化。

在動作識別任務(wù)中,目標(biāo)函數(shù)為:

其中 Y 和是預(yù)測值和幀值,這樣通過將預(yù)測任務(wù)的損失函數(shù)嵌入到識別任務(wù)中,以及主干網(wǎng)絡(luò)的共享,能在一定程度上幫助識別任務(wù)學(xué)習(xí)到更多的時序信息。為了保證過渡平滑,額外添加了一個權(quán)重因子,會隨著迭代次數(shù)的增加而線性衰減:

作者將這種方法稱為半監(jiān)督輔助學(xué)習(xí)。

實(shí)驗(yàn)結(jié)果

視頻預(yù)測任務(wù),在 Moving MINIST 數(shù)據(jù)集上的結(jié)果:

為了驗(yàn)證 E3D-LSTM 中不同模塊對性能的影響,作者還在該數(shù)據(jù)集上進(jìn)行了燒蝕研究:

可以看到不管是添加 3D 卷積還是自注意力機(jī)制,網(wǎng)絡(luò)性能相對于基線方法都有提升。

視頻預(yù)測任務(wù),在 KTH 人體動作數(shù)據(jù)集上的結(jié)果:

接下來在一個實(shí)際視頻預(yù)測任務(wù):交通流預(yù)測中,與其他方法進(jìn)行了對比:

動作識別任務(wù),在 Something-Something 數(shù)據(jù)集上進(jìn)行了測試:

同樣在該數(shù)據(jù)集上進(jìn)行了燒蝕研究:

以及不同的半監(jiān)督輔助學(xué)習(xí)策略帶來的性能提升:

總結(jié)

本文對 ST-LSTM 進(jìn)行了改進(jìn),將流行的 3D 卷積操作作為其基本張量操作,同時添加了自注意力模塊,進(jìn)一步強(qiáng)化了網(wǎng)絡(luò)對長距離依賴信息的刻畫能力,不僅能用于預(yù)測任務(wù),還能通過輔助學(xué)習(xí)的方法拓展到其他任務(wù)上,是非常具有啟發(fā)性的工作。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:數(shù)月整改,三星折疊屏手機(jī)Fold 終于可以發(fā)售了?

文章出處:【微信號:AppDowns,微信公眾號:掌上科技頻道】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    時延小于1毫秒,工信部發(fā)布全光算網(wǎng)絡(luò)重磅利好政策

    電子發(fā)燒友網(wǎng)報道(文/彎彎)當(dāng)下,人工智能(AI)技術(shù)飛速發(fā)展,算成為驅(qū)動數(shù)字經(jīng)濟(jì)發(fā)展的核心要素。AI應(yīng)用持續(xù)拓展,對底層算網(wǎng)絡(luò)的傳輸效率、時延控制和可靠性
    的頭像 發(fā)表于 10-20 07:17 ?1.1w次閱讀
    時延小于1毫秒,工信部發(fā)布全光算<b class='flag-5'>力</b><b class='flag-5'>網(wǎng)絡(luò)</b>重磅利好政策

    博世與清華大學(xué)簽約,共同探索碳中和領(lǐng)域前沿技術(shù)研究合作

    4月23日,博世集團(tuán)董事會主席史蒂凡?哈通博士 (Stefan Hartung) 一行訪問清華大學(xué)。校長路明在工字廳東廳會見來賓,并共同出席清華大學(xué)與博世合作簽約儀式,雙方共同探索碳中和領(lǐng)域
    的頭像 發(fā)表于 04-27 09:59 ?153次閱讀
    博世與<b class='flag-5'>清華</b>大學(xué)簽約,共同探索碳中和領(lǐng)域前沿技術(shù)研究合作

    Evermind AI 研發(fā)三階段 AI 記憶存儲提取架構(gòu)

    近日,由盛大集團(tuán)全資孵化的AI技術(shù)團(tuán)隊(duì)EverMind,正式對外系統(tǒng)性地展示AI記憶操作系統(tǒng)——EverMemOS,最新版本在四大記憶基準(zhǔn)上實(shí)現(xiàn)了最先進(jìn)(SOTA)準(zhǔn)確率。 EverMemOS:打破
    的頭像 發(fā)表于 03-04 15:21 ?506次閱讀

    清華大學(xué)在分焦面超像素陣列光刻制造領(lǐng)域取得新進(jìn)展

    國際研究生院星輝副教授團(tuán)隊(duì)在分焦面超像素陣列光刻制造領(lǐng)域取得新進(jìn)展,為中紅外偏振成像系統(tǒng)的關(guān)鍵器件制備提供了新方案。 圖2.本研究提出的混合光刻加工系統(tǒng) 針對中紅外偏振成像場景,研究團(tuán)隊(duì)
    的頭像 發(fā)表于 01-21 09:10 ?241次閱讀
    <b class='flag-5'>清華</b>大學(xué)在分焦面超像素陣列光刻制造領(lǐng)域取得新進(jìn)展

    亮亮視野AR智能眼鏡項(xiàng)目榮獲2025國際信息系統(tǒng)協(xié)會影響大獎

    產(chǎn)業(yè)合作伙伴,聯(lián)合伊拉大學(xué)、清華大學(xué)等頂尖高校團(tuán)隊(duì)共同完成的“賦能聽障人士的AR智能眼鏡”項(xiàng)目,榮獲“2025 AIS影響大獎(AI
    的頭像 發(fā)表于 12-26 13:45 ?676次閱讀

    一文讀懂LSTM與RNN:從原理到實(shí)戰(zhàn),掌握序列建模核心技術(shù)

    在AI領(lǐng)域,文本翻譯、語音識別、股價預(yù)測等場景都離不開序列數(shù)據(jù)處理。循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)作為最早的序列建模工具,開創(chuàng)了“記憶歷史信息”的先河;而長短期記憶網(wǎng)絡(luò)
    的頭像 發(fā)表于 12-09 13:56 ?1914次閱讀
    一文讀懂<b class='flag-5'>LSTM</b>與RNN:從原理到實(shí)戰(zhàn),掌握序列建模核心技術(shù)

    中國科研團(tuán)隊(duì)發(fā)布稀土材料最新成果

    據(jù)央視新聞報道中國科研團(tuán)隊(duì)發(fā)布稀土材料最新成果;日前又黑龍江大學(xué)、清華大學(xué)和新加坡國立大學(xué)合作完成的稀土材料突破性研究成果在《Nature》正式發(fā)表,標(biāo)志著科研團(tuán)隊(duì)成功攻克絕緣性稀土納米晶的高效
    的頭像 發(fā)表于 11-24 14:25 ?817次閱讀

    Vishay / BC Components NTCLE100E3與NTCLE203E3 NTC熱敏電阻數(shù)據(jù)手冊

    Vishay BC Components NTCLE100E3徑向引線標(biāo)準(zhǔn)精密和NTCLE 203E3徑向引線精密線路NTC熱敏電阻符合RoHS指令。該熱敏電阻在寬溫度范圍內(nèi)具有高精度,在整個
    的頭像 發(fā)表于 11-13 16:19 ?1277次閱讀
    Vishay / BC Components NTCLE100<b class='flag-5'>E3</b>與NTCLE203<b class='flag-5'>E3</b> NTC熱敏電阻數(shù)據(jù)手冊

    鳳凰智創(chuàng)榮獲DEKRA德凱ISO 26262 ASIL-D認(rèn)證

    近日,重慶賽鳳凰智創(chuàng)科技有限公司(以下簡稱“賽鳳凰智創(chuàng)”)順利通過ISO 26262:2018 ASIL-D汽車功能安全管理體系認(rèn)證
    的頭像 發(fā)表于 09-05 14:33 ?1631次閱讀

    成都華微赴賽開展技術(shù)交流學(xué)習(xí)

    近日,成都華微電子科技股份有限公司(以下簡稱成都華微)副總經(jīng)理朱志勇、董事會秘書春妍帶領(lǐng)公司核心研發(fā)團(tuán)隊(duì),赴重慶賽技術(shù)有限公司(以下簡稱賽
    的頭像 發(fā)表于 08-22 14:30 ?1692次閱讀

    清華博士團(tuán)隊(duì)的自供電振動傳感器初創(chuàng)企業(yè)振電智感,獲近千萬天使輪融資

    , 金額近千萬元 。本輪由 麟閣創(chuàng)投 領(lǐng)投, 水木清華校友基金 跟投,志云資本擔(dān)任本輪融資財務(wù)顧問。本輪資金將用于傳感器研發(fā)、測試產(chǎn)線建設(shè)及商業(yè)化團(tuán)隊(duì)搭建。 振電智感成立于2025年,由清華大學(xué)與新南威爾士大學(xué)的博士
    的頭像 發(fā)表于 08-18 17:38 ?1727次閱讀
    <b class='flag-5'>清華</b>博士<b class='flag-5'>團(tuán)隊(duì)</b>的自供電振動傳感器初創(chuàng)企業(yè)振電智感,獲近千萬天使輪融資

    芯片方案:專業(yè)視頻信號轉(zhuǎn)換UVC轉(zhuǎn)HDMI解決方案,支持大疆Pocket3

    一、核心功能與兼容設(shè)備炬 AM8271D 芯片方案專注于實(shí)現(xiàn) USB 信號到 HDMI 信號的高效轉(zhuǎn)換與投屏,兼容多款主流設(shè)備,包括: · 視頻創(chuàng)作設(shè)備:DJI Pocket3 等· 網(wǎng)絡(luò)
    發(fā)表于 07-04 17:08

    西湖大學(xué):實(shí)現(xiàn)微牛頓級別的高精度測量, 基于3D打印的新型光纖集成傳感器的開發(fā)

    微結(jié)構(gòu)設(shè)計能夠優(yōu)化傳感器內(nèi)部的應(yīng)力分布,增加有效接觸面積,從而提高傳感器的響應(yīng)速度和檢測范圍。3D打印技術(shù)可以精確地制造出這些微結(jié)構(gòu),充分發(fā)揮其在性能優(yōu)化方面的作用。” 在當(dāng)今科學(xué)研究中,微觀測量
    的頭像 發(fā)表于 05-22 18:07 ?1525次閱讀
    西湖大學(xué):實(shí)現(xiàn)微牛頓級別的高精度<b class='flag-5'>力</b>測量, 基于<b class='flag-5'>3D</b>打印的新型光纖集成<b class='flag-5'>力</b>傳感器的開發(fā)

    千億營收!賽赴港IPO,募資強(qiáng)攻AI、增程技術(shù)

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)4月28日,賽集團(tuán)股份有限公司(以下簡稱:賽)在港交所遞交招股書,擬在香港主板上市。 ? 賽
    的頭像 發(fā)表于 05-10 00:37 ?9657次閱讀
    千億營收!賽<b class='flag-5'>力</b><b class='flag-5'>斯</b>赴港IPO,募資強(qiáng)攻AI、增程技術(shù)

    清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)網(wǎng)絡(luò)智能體

    清華大學(xué)響應(yīng)國家教育新基建戰(zhàn)略,正在加速推進(jìn)網(wǎng)絡(luò)管理平臺升級:為滿足在線教育、協(xié)同創(chuàng)新及智慧校園的發(fā)展需求,為清華大學(xué)躋身世界一流大學(xué)創(chuàng)造基礎(chǔ)條件,清華大學(xué)攜手華為打造業(yè)內(nèi)首個園區(qū)
    的頭像 發(fā)表于 05-07 09:51 ?1008次閱讀
    长寿区| 黄龙县| 广饶县| 云霄县| 同德县| 洪洞县| 罗定市| 原阳县| 永胜县| 杭州市| 枣强县| 高邮市| 札达县| 文安县| 莒南县| 蒙自县| 大化| 屏边| 和顺县| 平泉县| 奎屯市| 句容市| 鄂伦春自治旗| 景东| 南丹县| 岳阳县| 新宁县| 深圳市| 华池县| 丹巴县| 桓仁| 大新县| 潜山县| 三原县| 伊宁市| 焉耆| 通江县| 乌兰县| 灵寿县| 富蕴县| 阿坝县|