日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌在Kaggle發(fā)布了一項(xiàng)地標(biāo)檢索挑戰(zhàn)賽

zhKF_jqr_AI ? 來源:未知 ? 作者:李倩 ? 2018-06-30 09:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

四個月前,谷歌在Kaggle發(fā)布了一項(xiàng)地標(biāo)檢索挑戰(zhàn)賽,在這場比賽中,參賽者會得到一些圖像,他們需要在所有圖像數(shù)據(jù)集中找到含有給定圖像中地標(biāo)的圖片。

圖像檢索是計(jì)算機(jī)視覺領(lǐng)域的基礎(chǔ)問題,對于包含地標(biāo)的圖像更是非常重要,因?yàn)檫@是用戶拍攝的熱門對象。本次挑戰(zhàn)賽的數(shù)據(jù)集是世界最大的圖像檢索數(shù)據(jù)集,其中有超過一百萬張圖像,覆蓋了全球1.5萬個不同景點(diǎn)。

同時,這項(xiàng)挑戰(zhàn)賽也是CVPR 2018的地標(biāo)辨認(rèn)研討會的一部分。下面就是本次競賽排名第一的解決方案,參賽隊(duì)伍是由anokas帶領(lǐng)的團(tuán)隊(duì),論智對其進(jìn)行了編譯。

解決方案包括兩個主要元素:

首先,創(chuàng)建一個高性能的全局描述符(global descriptor),它可以將數(shù)據(jù)庫中的圖像用奇異向量表示;

然后,創(chuàng)建一個高效的框架,能將這些向量和最可能的圖片聯(lián)系起來,最后提交到積分榜上。

下面是總體框架的流程圖,其中每一步應(yīng)用后都有對應(yīng)的LB分?jǐn)?shù)。

注:下文中所有分?jǐn)?shù)都以百分?jǐn)?shù)表示,即62.5%=0.625

方案詳細(xì)講解

全局描述符(Global Descriptors)

我們的方案中最主要的部分就是幾個全局描述符,這些向量描述了圖片的全部內(nèi)容。我們從兩個預(yù)訓(xùn)練的CNN模型開始(ResNet和ResNeXt),并用四種目前最先進(jìn)的集結(jié)方法(aggregation methods)生成全局描述符。下面是四種集結(jié)方法各自的細(xì)節(jié)以及它們“原始”的表現(xiàn)性能(也就是沒有進(jìn)行檢索詞擴(kuò)展和數(shù)據(jù)庫擴(kuò)展):

基于區(qū)域熵的多層抽象池化(REMAP)[42.8% mAP]:我們之前設(shè)計(jì)的一個全局描述符聚合了不同CNN層的深度特征,之后經(jīng)過訓(xùn)練可以表示多個水平的可視化抽象對象。我們將在之后的CVPR研討會上進(jìn)一步展示REMAP的細(xì)節(jié)架構(gòu)。

最大卷積激活值(MAC)[32.9% mAP]:MAC描述符將每個CNN的最后一層卷積過濾的最大局部回應(yīng)進(jìn)行編碼。在它的架構(gòu)中,ResNeXt的最后一個卷積層后面有一個最大池化層、L2-正則化層和PCA+白化層。

卷積的池化和(SPoC)[31.7% mAP]:在SPoC這一過程中,ResNeXt的最后一個卷積層后接池化和層、L2-正則化層和PCA+白化層。

卷積的區(qū)域最大激活值(RMAC)[34.7% mAP]:在RMAC中,ResNeXt最后的卷積特征是在多個規(guī)模重疊區(qū)域中進(jìn)行的最大池化。這些區(qū)域同樣是基于有L2-正則化層和PCA+白化層的描述符。最后把所有描述符匯總到一個單一的描述符中。

基礎(chǔ)的CNN網(wǎng)絡(luò)(ResNet和ResNeXt)是在ImageNet上進(jìn)行的訓(xùn)練,之后再一個地標(biāo)數(shù)據(jù)集的子集中進(jìn)行調(diào)整。該子集來自Babenko等人的研究成果,其中包括大約12萬張圖片和650個著名景點(diǎn)。

這一數(shù)據(jù)集中的圖像最初是在圖片搜索引擎中用文字搜到的,沒有經(jīng)過檢驗(yàn),所以其中可能含有很多不相關(guān)的圖片,這需要我們過濾掉。刪除圖片的過程是半自動的,利用帶有密集SIFT特征的Hessian-affine檢測器以及RVD-W描述符進(jìn)行聚合。處理完圖像后,還剩下25000張左右的圖片,都屬于一種地標(biāo),我們想用它對模型進(jìn)行調(diào)整。

我們沒有用其他類似競賽中的數(shù)據(jù)集作為訓(xùn)練數(shù)據(jù),因?yàn)槲覀兿肟纯丛谛碌臄?shù)據(jù)集下,我們的方案生成的效果如何。

合并描述符

通過用上述方法訓(xùn)練的六個全局描述符合并,就得到了最終的全局描述符(括號中的是LB分?jǐn)?shù)):

ResNeXt+REMAP(42.8%)

ResNeXt+RMAC(34.7%)

ResNeXt+MAC(32.9%)

ResNeXt+SPoC(31.7%)

ResNet+REMAP(35.8%)

ResNet+MAC(30.4%)

接著我們將每個描述符縮放到固定的L2 norm上,為每個描述符分配權(quán)重,按以下方式連接描述符:

XG = [2× ResNeXt+REMAP; 1.5× ResNeXt+RMAC; 1.5× ResNeXt+MAC; 1.5× ResNeXt+SPoC; ResNet+MAC; ResNet+REMAP]

權(quán)重的選擇是點(diǎn)對點(diǎn)的,以反映每種方法相應(yīng)的性能。之后,我們用PCA將描述符的維度降到4K,同時應(yīng)用白化,讓所有維度的方差相同。雖然PCA和白化只能改善一小部分,但是它將查詢擴(kuò)展的結(jié)果提升了幾個百分點(diǎn)。

最近鄰搜索

創(chuàng)建好描述符后,每張圖片都由一個4096維的描述符表示。接下來,我們用復(fù)雜的k-最近鄰搜索找到每張圖前2500個近鄰和L2距離。這一階段提交每張圖片的前100個最近鄰得到了47.2%的分?jǐn)?shù)。

這一步驟使用優(yōu)化過的NumPy代碼實(shí)現(xiàn),用了2小時對每個1.2M的圖片找出了前2500個最近鄰。

數(shù)據(jù)庫增強(qiáng)

接下來要做的是數(shù)據(jù)庫增強(qiáng)(DBA),即把數(shù)據(jù)庫中每張圖片的描述符換成它本身和前10個最近鄰的加權(quán)結(jié)合。目的就是利用它們近鄰的特征提高圖像表示的質(zhì)量。更準(zhǔn)確的是,我們進(jìn)行描述符的加權(quán)求和,其中權(quán)重按以下代碼計(jì)算:

weights = logspace(0, -1.5, 10)

有趣的是,在其他數(shù)據(jù)集上我們發(fā)現(xiàn)只要用大于兩個近鄰進(jìn)行增強(qiáng)就會讓分?jǐn)?shù)下降,但10個近鄰對數(shù)據(jù)集增強(qiáng)和圖片是最好的。

需要注意的是,DBA是整個過程中添加的最后一步,雖然它能讓分?jǐn)?shù)得到大幅提升,但是將它和查詢擴(kuò)展結(jié)合起來時,提升只有1%—2%。我們認(rèn)為這是由于數(shù)據(jù)庫擴(kuò)展與查詢擴(kuò)展方法的第一步很相似。

查詢擴(kuò)展

查詢擴(kuò)展是圖像檢索問題中的基礎(chǔ)技術(shù),通常對模型的性能有很大提升。它工作的原理是:如果A與B匹配,B與C匹配,那么A與C匹配。我們可以在下面的實(shí)例中看到這種原理的優(yōu)勢,圖中三個區(qū)域相互重疊:

在這一案例中,查詢擴(kuò)張系統(tǒng)可以將A和C聯(lián)系起來,判斷它們屬于同一場景,即使它們?nèi)置枋龇赡懿幌喾?。這在一些光線不同或視角不同的圖像中也很有用。

在這次比賽中,我們設(shè)計(jì)了一種新的、快速的技術(shù)用于查詢擴(kuò)展,它可以通過遞歸運(yùn)行捕捉圖像之間的長距離連接。這種特點(diǎn)非常適合這一問題,因?yàn)楹心硞€地標(biāo)的圖像有很多,只有一張圖像才能成為查詢結(jié)果,其他的只能歸為top 100的結(jié)果中。

第一次迭代后,查詢擴(kuò)展提升了約11%,進(jìn)行了30分鐘的遞歸運(yùn)行后,提升了14%,加入數(shù)據(jù)增強(qiáng)后這一結(jié)果有所下降。

簡化模型

在產(chǎn)品級機(jī)器學(xué)習(xí)環(huán)境中,由于收益遞減原則,幾乎不會使用大規(guī)模的多模型集成。通常使用較小的子集就能達(dá)到理想性能。我們想得到原來方案的簡化版本,只需要不到12個小時,僅僅用ResNeXt-REMAP和查詢擴(kuò)展就能得到56%—57%的分?jǐn)?shù)。

不足之處

局部描述符:這可能是我們在比賽中最意想不到的事。我們試了好幾種基于多種局部描述符的方法,包括使用和不使用幾何驗(yàn)證的方法,例如用它對我們的結(jié)果重新排名,或者用它從上到下瀏覽幾千個全局近鄰,找找有沒有遺漏掉的局部匹配。不知道其他隊(duì)伍使用局部描述符的情況如何,也許是基于CNN的全局描述符太好用了以至于局部的時代終結(jié)了?

處理旋轉(zhuǎn)圖像:在數(shù)據(jù)集中我們發(fā)現(xiàn)很多圖片都是旋轉(zhuǎn)的。我們用好幾種方法處理這個問題,例如在k-最近鄰方法中比較旋轉(zhuǎn)和不旋轉(zhuǎn)的描述符,并為每組圖像進(jìn)行最近匹配。但是分?jǐn)?shù)依然沒有變化。有可能是因?yàn)檫@個數(shù)據(jù)集有太多干擾項(xiàng)了,誤報(bào)率太高,即使真正匹配對整體分?jǐn)?shù)的影響也不大。

集成:我們試了好幾種方法將不同模型和方法的結(jié)果結(jié)合起來,例如排序平均和交錯預(yù)測等,然而成效不大。似乎早期將模型結(jié)合比結(jié)束時結(jié)合要好一些。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 圖像檢索
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    8208
  • 計(jì)算機(jī)視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1716

    瀏覽量

    47747
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1240

    瀏覽量

    26273

原文標(biāo)題:Kaggle地標(biāo)圖片檢索挑戰(zhàn)賽冠軍方案講解

文章出處:【微信號:jqr_AI,微信公眾號:論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    北京人形具身天工3.0斬獲全球首個全自主機(jī)器人勇士挑戰(zhàn)賽冠軍

    ,成功通關(guān)擺錘穿越、開拓前行、破門清障幾個基于現(xiàn)實(shí)高危場景設(shè)計(jì)的項(xiàng),以最高積分?jǐn)孬@全球首個全自主機(jī)器人勇士挑戰(zhàn)賽冠軍,并贏得勇士智行獎。
    的頭像 發(fā)表于 04-21 17:28 ?1125次閱讀

    思必馳斬獲Interspeech 2026音頻推理挑戰(zhàn)賽智能體賽道亞軍

    近日,國際語音與語言處理領(lǐng)域頂級賽事Interspeech 2026音頻推理挑戰(zhàn)賽結(jié)果正式揭曉。在這場首次將評估焦點(diǎn)從“答案正確性”轉(zhuǎn)向“推理過程質(zhì)量”的變革性賽事中,思必馳-上海交通大學(xué)聯(lián)合實(shí)驗(yàn)室團(tuán)隊(duì)?wèi){借創(chuàng)新的多智能體協(xié)同方案,全球眾多頂尖科研團(tuán)隊(duì)的角逐中脫穎而出,斬
    的頭像 發(fā)表于 02-28 14:13 ?864次閱讀

    AICAS 2026 Grand Challenge全球挑戰(zhàn)賽啟動

    第四屆AICAS Grand Challenge——AICAS 2026全球技術(shù)挑戰(zhàn)賽現(xiàn)已正式啟動,誠邀各界英才和技術(shù)先鋒共同參與,以“芯”智能驅(qū)動未來!
    的頭像 發(fā)表于 02-04 14:59 ?1081次閱讀

    第三屆開放原子大賽OpenTenBase兩大賽項(xiàng)圓滿落幕

    2025年12月19日,由開放原子開源基金會主辦,深圳市騰訊計(jì)算機(jī)系統(tǒng)有限公司承辦的“OpenTenBase多模態(tài)分析開發(fā)挑戰(zhàn)賽”與“OpenTenBase-TXSQL SQL改寫優(yōu)化挑戰(zhàn)賽”兩大賽項(xiàng)決賽路演
    的頭像 發(fā)表于 12-29 13:53 ?664次閱讀

    摩爾線程SIGGRAPH Asia 2025斬獲3DGS重建挑戰(zhàn)賽銀獎

    Challenge(3DGS 重建挑戰(zhàn)賽)中憑借自研技術(shù)LiteGS出色的算法實(shí)力和軟硬件協(xié)同優(yōu)化能力,斬獲銀獎,再次證明摩爾線程代圖形渲染技術(shù)上的深度積累與全球?qū)W術(shù)界的高度認(rèn)可。
    的頭像 發(fā)表于 12-22 18:01 ?2004次閱讀
    摩爾線程<b class='flag-5'>在</b>SIGGRAPH Asia 2025斬獲3DGS重建<b class='flag-5'>挑戰(zhàn)賽</b>銀獎

    2025 全國人工智能應(yīng)用場景創(chuàng)新挑戰(zhàn)賽AI Agent全球?qū)m?xiàng)線下半決賽新聞發(fā)布會在深圳召開

    12月10日下午,以“智啟未來,星耀深圳”為主題的2025全國人工智能應(yīng)用場景創(chuàng)新挑戰(zhàn)賽AI Agent 全球?qū)m?xiàng)線下半決賽新聞發(fā)布會在深圳召開。本次發(fā)布會由CICAS?AI Age
    的頭像 發(fā)表于 12-10 18:11 ?1360次閱讀
    2025 全國人工智能應(yīng)用場景創(chuàng)新<b class='flag-5'>挑戰(zhàn)賽</b>AI Agent全球?qū)m?xiàng)<b class='flag-5'>賽</b>線下半決賽新聞<b class='flag-5'>發(fā)布</b>會在深圳召開

    openDACS 2025 開源EDA與芯片項(xiàng) 題七:基于大模型的生成式原理圖設(shè)計(jì)

    ,形成了批具有應(yīng)用價值的技術(shù)成果。本屆大賽預(yù)計(jì)發(fā)布50個項(xiàng),持續(xù)規(guī)劃1500萬元總獎金。 openDACS2025開源EDA與芯片
    發(fā)表于 11-13 11:49

    東風(fēng)睿立達(dá)斬獲NEVC 2025中國新能源商用車挑戰(zhàn)賽項(xiàng)大獎

    9月15日,NEVC2025第十屆中國新能源商用車挑戰(zhàn)賽頒獎盛典圓滿落幕。東風(fēng)睿立達(dá)以卓越表現(xiàn)橫掃六項(xiàng)大獎,包括“大面組全能金獎”及四項(xiàng)關(guān)鍵單項(xiàng)冠軍,成為本屆賽事中最耀眼的新能源商用車之星。
    的頭像 發(fā)表于 09-16 16:57 ?1160次閱讀

    2025 EDA精英挑戰(zhàn)賽華大九天發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-26 15:00 ?1910次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>華大九天<b class='flag-5'>賽</b>題<b class='flag-5'>發(fā)布</b>

    2025 EDA精英挑戰(zhàn)賽紫光同創(chuàng)發(fā)布

    中國研究生創(chuàng)“ 芯 ” 大賽·EDA精英挑戰(zhàn)賽(以下簡稱EDA精英挑戰(zhàn)賽)是由教育部學(xué)位管理與研究生教育司指導(dǎo),中國學(xué)位與研究生教育學(xué)會、中國科協(xié)青少年科技中心主辦的“ 中國研究生創(chuàng)‘芯 ’大賽
    的頭像 發(fā)表于 08-25 09:40 ?2002次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>紫光同創(chuàng)<b class='flag-5'>賽</b>題<b class='flag-5'>發(fā)布</b>

    2025 EDA精英挑戰(zhàn)賽概倫電子發(fā)布

    近日,2025中國研究生創(chuàng)“芯”大賽·EDA精英挑戰(zhàn)賽正式拉開帷幕。作為國內(nèi)首家EDA上市公司,關(guān)鍵核心技術(shù)具備國際市場競爭力的EDA領(lǐng)軍企業(yè),同時也是集成電路設(shè)計(jì)自動化(EDA)產(chǎn)教融合聯(lián)盟
    的頭像 發(fā)表于 08-25 09:31 ?1548次閱讀
    2025 EDA精英<b class='flag-5'>挑戰(zhàn)賽</b>概倫電子<b class='flag-5'>賽</b>題<b class='flag-5'>發(fā)布</b>

    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計(jì)挑戰(zhàn)賽

    安富利旗下e絡(luò)盟社區(qū)與 Würth Elektronik 合作推出全球設(shè)計(jì)挑戰(zhàn)賽。這項(xiàng)全新競賽誠邀工程師、創(chuàng)客和愛好者們使用 Würth Elektronik 先進(jìn)的 SMD LED(集成了 WL-ICLED 控制器)開發(fā)原型或測試裝置。
    的頭像 發(fā)表于 07-23 10:15 ?1104次閱讀
    e絡(luò)盟社區(qū)攜手 Würth Elektronik 發(fā)起全球 LED 設(shè)計(jì)<b class='flag-5'>挑戰(zhàn)賽</b>

    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍,推動視頻畫質(zhì)升級

    近日,計(jì)算機(jī)視覺領(lǐng)域最具影響力的國際競賽CVPRNTIRE2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲高效超分辨率挑戰(zhàn)賽
    的頭像 發(fā)表于 06-24 17:03 ?1059次閱讀
    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩<b class='flag-5'>項(xiàng)</b><b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍,推動視頻畫質(zhì)升級

    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩項(xiàng)挑戰(zhàn)賽冠亞軍

    近日,計(jì)算機(jī)視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團(tuán)隊(duì)與上海交通大學(xué)圖像所MediaLab聯(lián)合團(tuán)隊(duì)分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1807次閱讀
    傳音多媒體團(tuán)隊(duì)攬獲CVPR NTIRE 2025兩<b class='flag-5'>項(xiàng)</b><b class='flag-5'>挑戰(zhàn)賽</b>冠亞軍

    ASML杯光刻「芯 」勢力知識挑戰(zhàn)賽正式啟動

    ASML光刻「芯」勢力知識挑戰(zhàn)賽由全球半導(dǎo)體行業(yè)領(lǐng)先供應(yīng)商ASML發(fā)起,是一項(xiàng)面向中國半導(dǎo)體人才與科技愛好者的科普賽事。依托ASML光刻領(lǐng)域的技術(shù)積累與行業(yè)洞察,賽事致力于為參賽者打造
    的頭像 發(fā)表于 06-23 17:04 ?1468次閱讀
    ASML杯光刻「芯 」勢力知識<b class='flag-5'>挑戰(zhàn)賽</b>正式啟動
    泰安市| 蓝山县| 古丈县| 花莲市| 建湖县| 呈贡县| 潼关县| 镇平县| 房山区| 汉阴县| 兴文县| 耿马| 大埔县| 贵州省| 红原县| 比如县| 崇明县| 红桥区| 庄河市| 泽库县| 邵东县| 顺平县| 乐山市| 延吉市| 措勤县| 金坛市| 清原| 牡丹江市| 德清县| 翁源县| 昭平县| 汶川县| 丰县| 云梦县| 和政县| 靖州| 婺源县| 鄂尔多斯市| 凤山市| 绥芬河市| 肇东市|