日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何實(shí)現(xiàn)更高效的VLN算法

深度學(xué)習(xí)自然語(yǔ)言處理 ? 來(lái)源:CAAI認(rèn)知系統(tǒng)與信息處理專(zhuān) ? 作者:CAAI認(rèn)知系統(tǒng)與信息 ? 2022-07-13 14:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

視覺(jué)-語(yǔ)言導(dǎo)航任務(wù)(Vision-Language Navigation, VLN)是指在陌生環(huán)境中,無(wú)人系統(tǒng)依據(jù)語(yǔ)言指示和觀測(cè)圖像之間的跨模態(tài)匹配信息,進(jìn)行自主智能路徑導(dǎo)航的方法。不同于前進(jìn)、后退等簡(jiǎn)單操控指令,VLN采用類(lèi)似人人交互的語(yǔ)言指示,比如“走出右側(cè)大門(mén),穿過(guò)臥室和客廳,在綠色地毯上的餐桌旁停下”。VLN是一種新型的跨模態(tài)智能人機(jī)交互方法,能夠極大地提升無(wú)人系統(tǒng)的自主能力,能夠?yàn)闊o(wú)人系統(tǒng)走向?qū)嵱锰峁╆P(guān)鍵技術(shù)支撐。

序列到序列(Sequence to Sequence, Seq2Seq)模型是VLN最常見(jiàn)的模型之一。Seq2Seq首先對(duì)語(yǔ)言指令進(jìn)行序列編碼,再根據(jù)逐步觀測(cè)的視覺(jué)圖像,進(jìn)行序列移動(dòng)方向預(yù)測(cè)解碼,從而實(shí)現(xiàn)智能導(dǎo)航。最新的研究表明:在解碼時(shí),利用Beam-Search進(jìn)行多條路徑探索,通過(guò)路徑評(píng)價(jià)函數(shù)獲得最優(yōu)導(dǎo)航路徑,可以獲得更好的導(dǎo)航精度。但現(xiàn)有工作使用的路徑評(píng)價(jià)函數(shù)是由局部方向選擇算子組合構(gòu)建的,在全局多條路徑對(duì)比上能力不足,可能會(huì)出現(xiàn)嚴(yán)重偏差,如圖1。

d1536476-01c9-11ed-ba43-dac502259ad0.png

圖1 VLN分?jǐn)?shù)偏差問(wèn)題示例

為了解決該問(wèn)題,軍事科學(xué)院國(guó)防科技創(chuàng)新研究院智能人機(jī)交互團(tuán)隊(duì)設(shè)計(jì)了新型全局路徑評(píng)估函數(shù),提出了一種全局對(duì)比訓(xùn)練的策略,大幅提升了VLN的導(dǎo)航精度。相關(guān)論文《Vision-Language Navigation with Beam-Constrained Global Normalization》已被國(guó)際知名期刊 IEEE Transactions on Neural Networks and Learning Systems錄用;該論文在提交時(shí),算法性能在公開(kāi)VLN數(shù)據(jù)集R2R(Room-to-Room)上排名第一。

d16cc222-01c9-11ed-ba43-dac502259ad0.jpg

榜單地址:https://eval.ai/web/challenges/challenge-page/97/leaderboard/270

主要工作與貢獻(xiàn)該論文提出了一種基于全局對(duì)比訓(xùn)練的視覺(jué)-語(yǔ)言導(dǎo)航方法,可以對(duì)候選路徑進(jìn)行跨模態(tài)全局匹配評(píng)估。不同于傳統(tǒng)方法,該論文主要聚集在如何利用正確路徑和錯(cuò)誤路徑進(jìn)行對(duì)比訓(xùn)練,獲得較優(yōu)的全局語(yǔ)言-路徑匹配評(píng)估函數(shù),有效提升VLN的導(dǎo)航精度。論文算法框架可以分為兩個(gè)部分:(1)Baseline:Seq2Seq模型,基于局部訓(xùn)練的序列動(dòng)作預(yù)測(cè),用于訓(xùn)練語(yǔ)言-路徑匹配的局部評(píng)估函數(shù);(2)全局對(duì)比訓(xùn)練模型:基于全局對(duì)比訓(xùn)練的全局評(píng)估函數(shù)。在測(cè)試時(shí),將局部評(píng)估函數(shù)和全局評(píng)估函數(shù)進(jìn)行結(jié)合,實(shí)現(xiàn)高精度的導(dǎo)航路徑預(yù)測(cè),如圖2所示。

d1a03f94-01c9-11ed-ba43-dac502259ad0.png

圖2 基于全局對(duì)比訓(xùn)練的VLN框架

A Baseline 如圖2所示,該論文選擇Seq2Seq模型作為Baseline,首先將語(yǔ)言信息進(jìn)行編碼,再基于視覺(jué)信息進(jìn)行動(dòng)作預(yù)測(cè)解碼。語(yǔ)言編碼:利用LSTM對(duì)輸入的自然語(yǔ)言文本進(jìn)行編碼,獲得文本指令的特征向量。視覺(jué)編碼:利用ResNet-152對(duì)觀測(cè)圖像進(jìn)行特征提取,結(jié)合運(yùn)動(dòng)方向特征進(jìn)行視覺(jué)編碼。動(dòng)作預(yù)測(cè):采用Seq2Seq模型進(jìn)行動(dòng)作解碼,獲得序列導(dǎo)航動(dòng)作。進(jìn)度監(jiān)視器:作為一項(xiàng)必不可少的輔助推理任務(wù),進(jìn)度監(jiān)視器可以提供來(lái)自環(huán)境的額外訓(xùn)練信息。訓(xùn)練:局部對(duì)比訓(xùn)練,只考慮當(dāng)前環(huán)境及下一步動(dòng)作。局部評(píng)估函數(shù):通過(guò)將局部方向選擇概率值累加,獲得整個(gè)路徑與描述語(yǔ)言的匹配度。B 基于Beam-Search的全局對(duì)比訓(xùn)練策略

Baseline將一個(gè)路徑的匹配度計(jì)算分解為單步方向選擇得分累加,由于單步方向得分是單獨(dú)計(jì)算的,沒(méi)有明確涵蓋全局信息,因此將Baseline評(píng)估函數(shù)稱(chēng)為局部評(píng)估函數(shù)。由于局部評(píng)估函數(shù)沒(méi)有從全局視角考慮路徑和語(yǔ)言的匹配度,所以局部得分累加的方式容易出現(xiàn)匹配錯(cuò)誤,為了緩解這一問(wèn)題,本文提出了明確的全局匹配評(píng)估函數(shù),并設(shè)計(jì)了全局訓(xùn)練策略進(jìn)行優(yōu)化訓(xùn)練,從而獲得高效的全局匹配評(píng)估函數(shù)。

具體來(lái)說(shuō),本文訓(xùn)練了一個(gè)全局評(píng)估子模型,主要用來(lái)進(jìn)行路徑-語(yǔ)言全局匹配評(píng)估,從而使得不同路徑的評(píng)估得分更加具有可比性。

d1b792b6-01c9-11ed-ba43-dac502259ad0.png

圖3 深度多模態(tài)相似性模塊和speaker模塊示意圖

DMSM模塊:計(jì)算語(yǔ)言的整體描述特征與路徑視覺(jué)的整體描述特征之間的距離;距離越近,則路徑和語(yǔ)言越匹配。Speaker模塊:根據(jù)路徑反向生成指令語(yǔ)言的概率,是VLN的逆命題,可以反映全局路徑和語(yǔ)言的匹配度。全局對(duì)比訓(xùn)練:在訓(xùn)練時(shí),利用Beam-Search搜索出多條正確路徑和多條錯(cuò)誤路徑,設(shè)計(jì)對(duì)比損失函數(shù),使得正確路徑得分高于錯(cuò)誤路徑,可以有效地對(duì)全局評(píng)估模塊DMSM和Speaker模塊進(jìn)行訓(xùn)練。全局評(píng)估函數(shù):在測(cè)試時(shí),對(duì)于任意一對(duì)路徑和語(yǔ)言,分別利用DMSM和Speaker模塊對(duì)二者之間的匹配度進(jìn)行計(jì)算,通過(guò)線(xiàn)性疊加,可以獲得該路徑的全局評(píng)估得分。

實(shí)驗(yàn)結(jié)果算法的測(cè)試是在VLN公開(kāi)數(shù)據(jù)集上進(jìn)行的。本文對(duì)比了多個(gè)現(xiàn)有經(jīng)典VLN算法,實(shí)驗(yàn)結(jié)果表明,本文提出的算法導(dǎo)航精度比Baseline高出13%,顯著度較高;在同期VLN算法的導(dǎo)航精度最高,證明了本文算法的有效性。

d1cca2fa-01c9-11ed-ba43-dac502259ad0.png

總結(jié)與展望本研究提出了一種 VLN 全局對(duì)比訓(xùn)練方法,用于緩解現(xiàn)有局部評(píng)估函數(shù)在全局路徑-語(yǔ)言匹配評(píng)估方面的不足。該方法核心要點(diǎn)是如何從錯(cuò)誤路徑/負(fù)樣本中學(xué)到有用的信息,這是現(xiàn)有其他VLN算法關(guān)注較少的地方,也是本文的落腳點(diǎn),實(shí)驗(yàn)結(jié)果表明了本文方法的有效性。

最近,通過(guò)視覺(jué)-語(yǔ)言跨模態(tài)預(yù)訓(xùn)練模型在VLN中性能表現(xiàn)優(yōu)越,比如VLN BERT,相對(duì)于傳統(tǒng)LSTM模型,預(yù)訓(xùn)練能夠獲得更多的先驗(yàn)知識(shí),能夠?yàn)閂LN提供更魯棒的基礎(chǔ)框架,本文未來(lái)工作將在VLN BERT等預(yù)訓(xùn)練模型的基礎(chǔ)上,進(jìn)一步利用全局對(duì)比訓(xùn)練方法,實(shí)現(xiàn)更高效的VLN算法。

原文標(biāo)題:VLN: 基于全局對(duì)比訓(xùn)練的視覺(jué)-語(yǔ)言導(dǎo)航方法

文章出處:【微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:彭靜
聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 智能導(dǎo)航
    +關(guān)注

    關(guān)注

    0

    文章

    25

    瀏覽量

    10162
  • 函數(shù)
    +關(guān)注

    關(guān)注

    3

    文章

    4423

    瀏覽量

    67885
  • 訓(xùn)練模型
    +關(guān)注

    關(guān)注

    1

    文章

    37

    瀏覽量

    4084

原文標(biāo)題:VLN: 基于全局對(duì)比訓(xùn)練的視覺(jué)-語(yǔ)言導(dǎo)航方法

文章出處:【微信號(hào):zenRRan,微信公眾號(hào):深度學(xué)習(xí)自然語(yǔ)言處理】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    意法半導(dǎo)體GaN驅(qū)動(dòng)洗衣機(jī)實(shí)現(xiàn)更高效率與可持續(xù)性

    實(shí)現(xiàn)家用電器可持續(xù)性的進(jìn)程中,制造商首要關(guān)注的重點(diǎn),是如何集成先進(jìn)電力技術(shù)、智能控制算法,以及高效電機(jī)控制和器件。
    的頭像 發(fā)表于 04-21 15:04 ?5115次閱讀
    意法半導(dǎo)體GaN驅(qū)動(dòng)洗衣機(jī)<b class='flag-5'>實(shí)現(xiàn)</b><b class='flag-5'>更高效</b>率與可持續(xù)性

    機(jī)場(chǎng)通信無(wú)雜音!A-29P 讓候機(jī)與調(diào)度更高效

    A-29P 沒(méi)有復(fù)雜的操作,也沒(méi)有冗余的功能,它以精準(zhǔn)的技術(shù)能力,破解機(jī)場(chǎng)通信的聲學(xué)難題 —— 讓航班調(diào)度更順暢,讓旅客服務(wù)更貼心,讓?xiě)?yīng)急處置更高效。
    的頭像 發(fā)表于 04-08 15:09 ?158次閱讀
    機(jī)場(chǎng)通信無(wú)雜音!A-29P 讓候機(jī)與調(diào)度<b class='flag-5'>更高效</b>

    BLDC芯片(MDF101A)丨高精度、低噪音、高效率的水下推進(jìn)控制方案

    ,相比傳統(tǒng)有刷電機(jī),效率與可靠性更高,同時(shí)避免電刷磨損與火花問(wèn)題。 系統(tǒng)采用無(wú)傳感器FOC(磁場(chǎng)定向控制)算法,實(shí)現(xiàn)高效率、低噪音及精準(zhǔn)推力控制。MDF101A芯片內(nèi)置高性能運(yùn)算放大
    發(fā)表于 04-07 15:56

    GMSSL:國(guó)密算法SM2、SM3、SM4的高效實(shí)現(xiàn)

    GMSSL是一個(gè)支持國(guó)家密碼算法(國(guó)密算法)的開(kāi)源密碼工具庫(kù),它提供了與OpenSSL類(lèi)似的功能,但特別強(qiáng)化了國(guó)密算法支持,主要包括: 國(guó)密算法實(shí)現(xiàn)
    的頭像 發(fā)表于 01-05 20:59 ?660次閱讀
    GMSSL:國(guó)密<b class='flag-5'>算法</b>SM2、SM3、SM4的<b class='flag-5'>高效</b><b class='flag-5'>實(shí)現(xiàn)</b>

    SM4算法實(shí)現(xiàn)分享(一)算法原理

    ,Xi、Yi、rki為字,i=0,1,2,…,31。則本算法的加密實(shí)現(xiàn)為: 本算法的解密實(shí)現(xiàn)與加密實(shí)現(xiàn)結(jié)構(gòu)是相同的,不同的只是提供的輪
    發(fā)表于 10-30 08:10

    Camellia算法實(shí)現(xiàn)(基于開(kāi)源蜂鳥(niǎo)E203協(xié)處理器)

    項(xiàng)目構(gòu)想 我們一開(kāi)始就選擇信息安全作為芯來(lái)杯比賽方向,并以Camellia算法作為算法原型。借助蜂鳥(niǎo)E203的協(xié)處理,能加速Camellia算法的運(yùn)算,并通過(guò)比較軟件實(shí)現(xiàn)和硬件
    發(fā)表于 10-30 07:04

    復(fù)雜的軟件算法硬件IP核的實(shí)現(xiàn)

    具體方法與步驟 通過(guò) C 語(yǔ)言實(shí)現(xiàn)軟件算法,并驗(yàn)證了算法的有效性以后,就可以進(jìn)行算法的 HDL 轉(zhuǎn)化工作了。通過(guò)使用 Altium Designer 的 CHC 編譯器(C to H
    發(fā)表于 10-30 07:02

    AES加解密算法邏輯實(shí)現(xiàn)及其在蜂鳥(niǎo)E203SoC上的應(yīng)用介紹

    這次分享我們會(huì)簡(jiǎn)要介紹AES加解密算法的邏輯實(shí)現(xiàn),以及如何將AES算法做成硬件協(xié)處理器集成在蜂鳥(niǎo)E203 SoC上。 AES算法介紹 AES算法
    發(fā)表于 10-29 07:29

    TCORDIC算法實(shí)現(xiàn)正余弦函數(shù)

    TCORDIC算法,由低延遲CORDIC算法和Taylor展開(kāi)組成。Taylor展開(kāi)計(jì)算作為CORDIC算法的補(bǔ)充,能夠結(jié)合CORDIC算法和Taylor展開(kāi)方式來(lái)計(jì)算浮點(diǎn)正余弦函數(shù),
    發(fā)表于 10-29 06:30

    如何使用恢復(fù)算法來(lái)實(shí)現(xiàn)開(kāi)平方運(yùn)算

    本文主要描述如何使用恢復(fù)算法來(lái)實(shí)現(xiàn)開(kāi)平方運(yùn)算。 簡(jiǎn)介 開(kāi)平方的恢復(fù)算法其實(shí)與除法的恢復(fù)算法十分相似。首先我們假設(shè)X為輸入的操作數(shù)(它應(yīng)該為正數(shù)),而他的平方根可以表示為Qn=0.q1
    發(fā)表于 10-24 13:33

    數(shù)據(jù)濾波算法的具體實(shí)現(xiàn)步驟是怎樣的?

    ? 數(shù)據(jù)濾波算法在電能質(zhì)量在線(xiàn)監(jiān)測(cè)裝置中的具體實(shí)現(xiàn),需圍繞 “ 數(shù)據(jù)采集→預(yù)處理→算法執(zhí)行→參數(shù)適配→效果驗(yàn)證→結(jié)果輸出 ” 的全流程展開(kāi),核心是結(jié)合裝置硬件特性(采樣率、ADC 精度)和干擾類(lèi)型
    的頭像 發(fā)表于 10-10 16:45 ?1031次閱讀

    線(xiàn)上研討會(huì) | @9/23 Tinyswitch5不Tiny,擁有更高效、更高瓦更精簡(jiǎn)的變頻反馳式架構(gòu)

    9月23日,大聯(lián)大詮鼎集團(tuán)攜手PI將做客大大通直播間帶來(lái)“Tinyswitch5不Tiny,擁有更高效更高瓦、更精簡(jiǎn)的變頻反馳式架構(gòu)”主題研討會(huì),邀您了解TinySwitch-5:更高效、更強(qiáng)
    的頭像 發(fā)表于 09-18 08:18 ?335次閱讀
    線(xiàn)上研討會(huì) | @9/23 Tinyswitch5不Tiny,擁有<b class='flag-5'>更高效</b>、<b class='flag-5'>更高</b>瓦更精簡(jiǎn)的變頻反馳式架構(gòu)

    高動(dòng)態(tài)響應(yīng)云臺(tái)電機(jī)驅(qū)動(dòng)電路設(shè)計(jì)及控制算法實(shí)現(xiàn)

    高動(dòng)態(tài)響應(yīng)云臺(tái)馬達(dá)驅(qū)動(dòng)方案電路設(shè)計(jì)及控制算法實(shí)現(xiàn)是當(dāng)前精密控制領(lǐng)域的重要研究方向,尤其在無(wú)人機(jī)、光電跟蹤、機(jī)器人等應(yīng)用場(chǎng)景中,對(duì)云臺(tái)的快速響應(yīng)能力和穩(wěn)定精度提出了更高要求。本文將圍繞驅(qū)動(dòng)電路硬件設(shè)計(jì)和控制
    的頭像 發(fā)表于 08-14 17:59 ?1609次閱讀

    基于FPGA實(shí)現(xiàn)FOC算法之PWM模塊設(shè)計(jì)

    哈嘍,大家好,從今天開(kāi)始正式帶領(lǐng)大家從零到一,在FPGA平臺(tái)上實(shí)現(xiàn)FOC算法,整個(gè)算法的框架如下圖所示,如果大家對(duì)算法的原理不是特別清楚的話(huà),可以先去百度上學(xué)習(xí)一下,本教程著重介紹
    的頭像 發(fā)表于 07-17 15:21 ?3748次閱讀
    基于FPGA<b class='flag-5'>實(shí)現(xiàn)</b>FOC<b class='flag-5'>算法</b>之PWM模塊設(shè)計(jì)

    基于FPGA的壓縮算法加速實(shí)現(xiàn)

    本設(shè)計(jì)中,計(jì)劃實(shí)現(xiàn)對(duì)文件的壓縮及解壓,同時(shí)優(yōu)化壓縮中所涉及的信號(hào)處理和計(jì)算密集型功能,實(shí)現(xiàn)對(duì)其的加速處理。本設(shè)計(jì)的最終目標(biāo)是證明在充分并行化的硬件體系結(jié)構(gòu) FPGA 上實(shí)現(xiàn)算法時(shí),可
    的頭像 發(fā)表于 07-10 11:09 ?2624次閱讀
    基于FPGA的壓縮<b class='flag-5'>算法</b>加速<b class='flag-5'>實(shí)現(xiàn)</b>
    双江| 北宁市| 遵化市| 长治市| 铁力市| 南开区| 东阿县| 门头沟区| 辽源市| 常宁市| 宝应县| 土默特左旗| 广汉市| 临海市| 永善县| 晋江市| 荔浦县| 个旧市| 宁南县| 定边县| 舟曲县| 诸暨市| 辽中县| 凤山县| 樟树市| 肇东市| 丘北县| 志丹县| 柳州市| 宜城市| 迁安市| 长葛市| 皋兰县| 马鞍山市| 渭南市| 弋阳县| 宜川县| 鄱阳县| 宝丰县| 通州区| 探索|