日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2019競賽第一解決方案分享

DPVg_AI_era ? 來源:lq ? 2019-06-23 07:58 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CVPR 2019細粒度圖像分類workshop的挑戰(zhàn)賽公布了最終結(jié)果:中國團隊DeepBlueAI獲得冠軍。本文帶來冠軍團隊解決方案的技術(shù)分享。

近日,在Kaggle上舉辦的CVPR 2019 Cassava Disease Classification挑戰(zhàn)賽公布了最終結(jié)果,國內(nèi)團隊 DeepBlueAI 獲得冠軍。

國際計算機視覺與模式識別會議(CVPR)是IEEE一年一度的學術(shù)性會議,CVPR是世界頂級的計算機視覺會議之一,會議的主要內(nèi)容是計算機視覺與模式識別技術(shù)。CVPR 2019 在洛杉磯長灘舉行,F(xiàn)GVC6 Workshop也將作為 CVPR 2019 的一部分如期召開。FGVC6 Workshop 共有十個挑戰(zhàn)賽,每個都代表了細粒度視覺分類在某個細分領(lǐng)域的挑戰(zhàn)。

FGVC全稱為Fine-Grained Visual Categorization,細粒度圖像分類,即區(qū)分不同的動物和植物、汽車和摩托車模型、建筑風格等,是機器視覺社區(qū)剛剛開始解決的最有趣和最有用的開放問題之一。細粒度圖像分類在于基本的分類識別(對象識別)和個體識別(人臉識別,生物識別)之間的連續(xù)性。相似的類別之間的視覺區(qū)別通常非常小,因此很難用當今的通用識別算法來解決。

今年是FGVC舉辦的第六屆比賽,往屆比較著名的比賽諸如iNaturalist和iMaterialist,前者側(cè)重于區(qū)分自然界不同的生物,后者則是側(cè)重于區(qū)分不同的人造物體。

不同于傳統(tǒng)的廣義上的分類任務(wù),F(xiàn)GVC的挑戰(zhàn)致力于子類別的劃分,需要分類的對象之間更加相似,例如區(qū)分不同的鳥類、不同的植物、不同的日用品等。

賽題介紹

Cassava Disease Classification挑戰(zhàn)賽是一個根據(jù)木薯的葉子區(qū)分不同種類的木薯疾病的任務(wù)。Cassava 譯為木薯,是非洲第二大碳水化合物供應(yīng)者,因為其能夠承受惡劣的環(huán)境。因此木薯是小農(nóng)種植的一種關(guān)鍵的糧食安全作物,在撒哈拉以南非洲,至少80%的小農(nóng)家庭種植木薯,而病毒性疾病是低產(chǎn)量的主要來源。

在這次比賽中,主辦方引入一個包含5種類別的木薯葉疾病的數(shù)據(jù)集,該數(shù)據(jù)集源于在烏干達定期調(diào)查中收集到的9436標記圖像,主要從農(nóng)民在自家田地里拍攝的圖片,然后由國家作物資源研究所(NaCRRI)與Makarere大學的人工智能實驗室共同對圖像進行標注。

數(shù)據(jù)集包括木薯植株的葉子圖像,9,436張帶注釋的圖像和12,595張未標記的圖像。參與者可以選擇使用未標記的圖像作為額外的訓練數(shù)據(jù)。目標是學習一個模型,使用訓練數(shù)據(jù)中的圖像將給定的圖像分類為這4個疾病類別或健康葉子的類別。

團隊成績

題目特點以及常用方法

細粒度圖像分類 (Fine-grained imagecategorization), 又被稱作子類別圖像分類 (Sub-category recognition)。其目的是對屬于同一基礎(chǔ)類別的圖像進行更加細致的子類劃分, 但由于子類別間細微的類間差異以及較大的類內(nèi)差異, 更傳統(tǒng)的圖像分類任務(wù)相比, 細粒度圖像分類難度明顯要大很多。從下圖中的木薯的葉子可以看出,不同的葉子病變情況長相非常相似,此外同一類別由于姿態(tài),背景以及拍攝角度的不同,存在較大的類內(nèi)差異。

細粒度圖像分類的常用方法可以分為兩種,分別是基于強監(jiān)督信息的方法和僅使用弱監(jiān)督信息的方法。前者需要使用對象的邊界框和局部標注信息,后者僅使用類別標簽,Cassava Disease Classification是一種弱監(jiān)督信息的細粒度識別,一般采用預訓練模型finetune,并結(jié)合訓練技巧對模型精調(diào)。

實驗?zāi)P停篠ENet、ResNet、DenseNet

ResNet是CNN歷史上一個里程碑事件,模型深度達到了152層,這和之前CNN的層數(shù)完全不在一個量級上。ResNet中的identity的這條線類似一條電路上的短路(shortcuts,skip connection),使得模型學習更加容易,深層可以直接得到淺層的網(wǎng)絡(luò)特征。

DenseNet的原理不同于ResNet通過加深網(wǎng)絡(luò)層數(shù)以及Inception通過加寬網(wǎng)絡(luò)寬度來提高模型識別能力,而是利用特征重用和類似ResNet的Bypass的方式,減少了網(wǎng)絡(luò)參數(shù)和緩解了梯度消失的問題。

SENet提出了Sequeeze and Excitation block,該模塊于傳統(tǒng)網(wǎng)絡(luò)的最大區(qū)別在于其側(cè)重于構(gòu)建通道之間的依賴關(guān)系,利用global average pooling來Sequeeze特征圖,并用Excitation對前者進行非線性變換,最后再疊加到輸入特征上??梢宰赃m應(yīng)的校準通道的相應(yīng)特征,并且該模塊可以嵌入到現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)中,實現(xiàn)精度的提升。

模型訓練與評測

原圖 VerticalFlip HorizontalFlip RandomRotateRandomCrop

RandomErasing

CutOut

由于訓練集樣本過少,對比分析后對輸入數(shù)據(jù)采取 VerticalFlip,HorizontalFilp 、RandomRotate和RandomCrop的增強操作。此外,還使用了RandomErasing和Cutout,方法會在原圖隨機選擇一些矩形區(qū)域,改變該區(qū)域的像素值,通過這些數(shù)據(jù)增強的方式,訓練集的圖片會被不同程度的遮擋,這樣可以進一步降低過擬合的風險并提高模型的魯棒性。

同樣的,為了增強模型的魯棒性減少過擬合,本次比賽我們利用5-fold crossvalidation,交叉驗證有效利用了有限的數(shù)據(jù),并且評估結(jié)果能夠盡可能接近模型在測試集上的表現(xiàn)。用crossvalidation之后,SE_ResNeXt50測試集準確率提升0.01016,ResNet34測試集準確率提升0.01142。

這次比賽中,我們還使用了Mixup和label smoothing的訓練策略。Mixup顧名思義就是將兩張圖片按一定比例融合起來作為輸入,計算loss時,針對兩張圖片的標簽分別計算,然后按比例加權(quán)求和。Mixup是一種抑制過擬合的策略,通過增加了一些數(shù)據(jù)上的擾動,從而提升了模型的泛化能力。

實驗證明,該方式能將Top1準確率提高近一個百分點。對于分類問題,常規(guī)做法時將類別換成one-hot vector。由于標簽是類別的one-hot vector,這樣做易導致過擬合使得模型泛化能力下降;同時這種做法會將所屬類別和非所屬類別之間的差距盡可能大,因此很難調(diào)優(yōu)模型。

為此,可以用label smoothing對標簽進行平滑處理,軟化one-hot類型標簽,使得計算損失函數(shù)時能有效抑制過擬合現(xiàn)象。

訓練以Adam為optimiser,學習率的設(shè)置為階梯狀,共四個取值,[3e-4, 1e-4,1e-5, 1e-6],設(shè)置patience為4來衰減學習率,即模型連續(xù)4個epoch在驗證集上效果沒有提升則衰減學習率,訓練總的epcoh在20次左右。本實驗使用的GPU為4卡2080Ti,并行訓練一個模型,batchsize通常設(shè)為32,較大的模型根據(jù)實際情況適當減小。

模型在預測時采用了數(shù)據(jù)增強的方式Test time augmentation(TTA),即將樣本圖像進行多個不同的變換獲得多個不同的預測結(jié)果,再將預測結(jié)果進行平均,提高精度。本次任務(wù)利用3*TTA,包括 RandomCrop, RandomCrop+HorizontalFlip 和RandomCrop+VerticalFlip 。

模型集成是算法比賽中常用的提高模型精度方法,本次比賽我們訓練了大量在ImageNet上表現(xiàn)優(yōu)良的模型,其中表現(xiàn)較好的模型如下表所示、在采取多種融合方式之后,最終發(fā)現(xiàn)SE_ResNeXt50、SE_ResNeXt101、SENet154以及DenseNet201按照歸一化后權(quán)重的融合效果最好,在測試集上的準確率達到了0.92516。

模型 測試集準確率
SE_ResNeXt50 0.92251
SE_ResNeXt101 0.92384
SENet154 0.92384
DenseNet201 0.91721
MobileNetV2 0.91601
ResNet152 0.91710
SE_ResNeXt50+SE_ResNeXt101+SENet154+DenseNet201 0.92516

本次比賽主辦方提供了12595張未帶label的額外數(shù)據(jù)集,為了充分利用該數(shù)據(jù)集,利用在測試集表現(xiàn)最好的融合模型給這些數(shù)據(jù)集貼上偽標簽。然后利用訓練集和偽標簽數(shù)據(jù)集訓練模型,為了防止模型在偽標簽上過擬合,我們對偽標簽采取了一定的篩選操作。

采取的思路是:用多個不同概率閾值的過濾所得到的偽標簽進行線下實驗,看哪個閾值下的數(shù)據(jù)在線下的表現(xiàn)最好,就用通過該閾值篩選過濾出的數(shù)據(jù),最終以0.95的閾值篩選出一半的數(shù)據(jù)作為添加到訓練集的偽標簽數(shù)據(jù)。

實驗證明這種半監(jiān)督的學習方法具有更強的泛化能力。

模型 測試集準確率
(public leaderboard)
Private leaderboard
SE_ResNeXt50 0.92251 0.93012
SE_ResNeXt50 with pseudo data 0.92195 0.93512
SE_ResNeXt101 0.92384 0.93134
SE_ResNeXt101 with pseudo data 0.92202 0.93409
SENet154 0.92384 0.93054
SE_ResNeXt154 with pseudo data 0.92283 0.93428
SE_ResNeXt50+SE_ResNeXt101+
SENet154+DenseNet201
0.92516 0.93727
SE_ResNeXt50+SE_ResNeXt101+
SENet154+DenseNet201
with pseudo data
0.92516 0.93860

進一步工作

針對細粒度圖像分類,MSRA有一個結(jié)論:分析該問題時圖像的形態(tài)、輪廓特征原沒細節(jié)紋理特征重要,而傳統(tǒng)的CNN模型都是在構(gòu)建輪廓特征,因此在構(gòu)建神經(jīng)網(wǎng)絡(luò)時,應(yīng)該更加精確地找到圖像中最有區(qū)分度的子區(qū)域,然后再對這些區(qū)域采用高分辨率、精細化特征的方法,這樣可以進一步提高細粒度圖像分類的準確率。

另外對數(shù)據(jù)本身我們可能需要做更多的工作,在任務(wù)初期沒有做足夠的探索性數(shù)據(jù)分析,例如數(shù)據(jù)的分布、類型、輸入圖像的尺寸等都是影響結(jié)果的因素,因此數(shù)據(jù)分析也是后面的一個嘗試點。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關(guān)注

    關(guān)注

    2

    文章

    1096

    瀏覽量

    42456
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50403

    瀏覽量

    267265
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1716

    瀏覽量

    47746

原文標題:CVPR 2019細粒度圖像分類競賽中國團隊DeepBlueAI獲冠軍 | 技術(shù)干貨分享

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    為什么選擇 Nordic 的低功耗藍牙解決方案?

    為什么選擇 Nordic 的低功耗藍牙解決方案?強大的無線 SoC 產(chǎn)品組合: 我們豐富的超低功耗無線 SoC 選件具有可擴展的內(nèi)存配置和功能集,可滿足各種需求。如果存儲器或功能要求發(fā)生意外變化
    發(fā)表于 04-16 10:40

    地平線11篇論文強勢入選CVPR 2026

    近日,計算機視覺與模式識別領(lǐng)域國際頂會CVPR 2026 (IEEE/CVF Conference on Computer Vision and Pattern Recognition) 正式公布
    的頭像 發(fā)表于 03-18 15:18 ?892次閱讀
    地平線11篇論文強勢入選<b class='flag-5'>CVPR</b> 2026

    CVPR 2019看事件相機步態(tài)識別:技術(shù)突破與產(chǎn)品應(yīng)用

    這篇題為《EV-Gait:Event-basedRobustGaitRecognitionusingDynamicVisionSensors》的論文發(fā)表于計算機視覺領(lǐng)域的頂級會議CVPR2019
    的頭像 發(fā)表于 02-27 16:22 ?967次閱讀
    從<b class='flag-5'>CVPR</b> <b class='flag-5'>2019</b>看事件相機步態(tài)識別:技術(shù)突破與產(chǎn)品應(yīng)用

    ALTAIR 電子行業(yè)解決方案

    Altair解決方案概述仿真、HPC和數(shù)據(jù)分析平臺建模和可視化物理求解器
    的頭像 發(fā)表于 12-04 17:58 ?478次閱讀
    ALTAIR 電子行業(yè)<b class='flag-5'>解決方案</b>(<b class='flag-5'>一</b>)

    東軟集團位居2024年中國智慧人社解決方案市場份額第一

    近日,國際數(shù)據(jù)公司(IDC)發(fā)布《中國智慧人社解決方案市場份額,2024:AI使能新業(yè)態(tài)發(fā)展》(IDC #CHC53830125,2025年10月)報告。報告顯示,東軟集團再次蟬聯(lián)市場份額第一,持續(xù)領(lǐng)跑智慧人社市場。
    的頭像 發(fā)表于 11-21 09:53 ?900次閱讀
    東軟集團位居2024年中國智慧人社<b class='flag-5'>解決方案</b>市場份額<b class='flag-5'>第一</b>

    DALI數(shù)字照明控制的解決方案

    NDA102 DALI數(shù)字照明控制解決方案基于數(shù)字照明接口聯(lián)盟(DiiA)開發(fā)的數(shù)字可尋址照明接口(DALI)技術(shù)。該解決方案包括新唐構(gòu)建的IEC 62386庫。新唐是DiiA準會員,擁有DALI
    發(fā)表于 09-08 06:29

    無人超市解決方案 智慧新零售解決方案

    通過閱讀本篇文章,你將了解到:1.為什么需要無人超市解決方案?2.無人超市是什么?3.無人超市的常見應(yīng)用場景4.無人超市解決方案的功能有哪些?5.無人超市的最佳實踐案例、為什么需要無人超市
    的頭像 發(fā)表于 08-22 10:22 ?1404次閱讀
    無人超市<b class='flag-5'>解決方案</b> 智慧新零售<b class='flag-5'>解決方案</b>

    地平線H-RDT模型斬獲CVPR 2025大賽冠軍

    近日,在計算機視覺與模式識別領(lǐng)域頂級會議CVPR 2025舉辦的RoboTwin雙臂機器人競賽中,地平線機器人實驗室與清華大學計算機系朱軍團隊聯(lián)合提出的H-RDT憑強大性能和領(lǐng)先成功率,舉斬獲真機賽冠軍(
    的頭像 發(fā)表于 08-21 10:02 ?828次閱讀
    地平線H-RDT模型斬獲<b class='flag-5'>CVPR</b> 2025大賽冠軍

    叉車限速解決方案

    叉車的動力系統(tǒng),響應(yīng)迅速,限速效果穩(wěn)定可靠,且對叉車原有結(jié)構(gòu)改動較小,適配性較強。 三、聲光預警 聲光預警功能是限速解決方案中的重要輔助部分。當叉車即將達到限速值或出現(xiàn)超速情況時,裝置會立即啟動聲光
    發(fā)表于 08-20 14:00

    首屆“天馬杯”ICDT車載顯示創(chuàng)新競賽圓滿落幕

    前沿技術(shù),發(fā)揮個人科研興趣和創(chuàng)新能力,提出具備實際應(yīng)用價值的解決方案。作為項全國性賽事,競賽不僅為高校學生提供豐富產(chǎn)業(yè)應(yīng)用知識、培養(yǎng)實踐能力的平臺,更致力于推動顯示技術(shù)的創(chuàng)新發(fā)展與應(yīng)用。
    的頭像 發(fā)表于 08-19 09:55 ?1249次閱讀

    華為成為5G RAN解決方案領(lǐng)域的唯領(lǐng)導者

    近日,全球權(quán)威咨詢機構(gòu)GlobalData發(fā)布了2025年《5G RAN競爭力評估報告》(以下簡稱《報告》)。華為憑借領(lǐng)先的解決方案和成熟商用案例已連續(xù)7年蟬聯(lián)第一,并以5G-A和AI融合解決方案持續(xù)擴大領(lǐng)先優(yōu)勢,成為本年度唯
    的頭像 發(fā)表于 08-15 09:29 ?3307次閱讀
    華為成為5G RAN<b class='flag-5'>解決方案</b>領(lǐng)域的唯<b class='flag-5'>一</b>領(lǐng)導者

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1420次閱讀

    潤和軟件穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一

    ”)憑借自身卓越的技術(shù)實力和創(chuàng)新能力,連續(xù)五年穩(wěn)居數(shù)字業(yè)務(wù)類解決方案市場第一名;在細分領(lǐng)域:數(shù)字信貸系統(tǒng)解決方案子市場持續(xù)保持第一名,數(shù)字銀行解決方
    的頭像 發(fā)表于 07-14 17:36 ?1510次閱讀

    傳音多媒體團隊攬獲CVPR NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    近日,在計算機視覺領(lǐng)域最具影響力的國際競賽 CVPR NTIRE 2025中,傳音多媒體團隊與上海交通大學圖像所MediaLab聯(lián)合團隊分別斬獲 高效超分辨率挑戰(zhàn)賽(NTIRE 2025
    的頭像 發(fā)表于 06-24 16:08 ?1805次閱讀
    傳音多媒體團隊攬獲<b class='flag-5'>CVPR</b> NTIRE 2025兩項挑戰(zhàn)賽冠亞軍

    如何在ctd解決方案中使用FRS (ccg2,3)?

    的話,你能否給我舉個來自 ctd us 解決方案代碼的示例,這是 ctd 解決方案的示例代碼? 如果那不起作用,除了圖片的設(shè)置之外我還需要留點什么嗎? 上面的代碼說,frs_enable 將在初始協(xié)商后應(yīng)用,所以我
    發(fā)表于 05-27 07:56
    朔州市| 芜湖县| 平罗县| 太康县| 濮阳市| 宁乡县| 南岸区| 兰溪市| 镇宁| 阿瓦提县| 新闻| 连江县| 桂阳县| 四川省| 孝昌县| 云梦县| 翼城县| 娱乐| 平顶山市| 濉溪县| 自贡市| 铁力市| 泌阳县| 营山县| 吴旗县| 麻城市| 织金县| 新余市| 保德县| 平乐县| 巩留县| 洞头县| 鄂州市| 瑞昌市| 永定县| 徐汇区| 邹平县| 桂阳县| 印江| 铅山县| 宁晋县|