日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

我們對(duì)目前機(jī)器學(xué)習(xí)進(jìn)展的衡量有多可靠?

jmiy_worldofai ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-06-08 14:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

我們對(duì)機(jī)器學(xué)習(xí)的發(fā)展認(rèn)識(shí),很大程度上取決于少數(shù)幾個(gè)標(biāo)準(zhǔn)基準(zhǔn),比如CIFAR-10,ImageNet或MuJoCo。

近年來(lái)人工智能發(fā)展,大的,比如一項(xiàng)又一項(xiàng)“超越人類(lèi)水平”的進(jìn)步,以及小的、甚至幾乎每天都在發(fā)生的(這要感謝Arxiv),比如在各種論文中不斷被刷新的“state-of-the-art”,無(wú)不讓人感嘆領(lǐng)域的蓬勃。

但是,實(shí)際情況或許并沒(méi)有這么美好。

一項(xiàng)伯克利和MIT合作的新研究,對(duì)過(guò)去近十年中提出的一些經(jīng)典分類(lèi)器(比如VGG和ResNet)進(jìn)行再測(cè)試后發(fā)現(xiàn),由于測(cè)試集過(guò)擬合,很多分類(lèi)器的精度實(shí)際并沒(méi)有宣稱的那么高;在新的數(shù)據(jù)集上測(cè)試結(jié)果表明,這些分類(lèi)器的精度普遍都有下降,幅度4%~10%不等。

研究者表示,這一結(jié)果可以被視為證據(jù),證明模型的精度這個(gè)數(shù)字是不可靠的,并且容易受到數(shù)據(jù)分布中微小的自然變化的影響。

這項(xiàng)新的研究也提出了一個(gè)值得反思的問(wèn)題——我們目前用來(lái)衡量機(jī)器學(xué)習(xí)進(jìn)展的手段和方法,究竟有多可靠?

重復(fù)使用相同的測(cè)試集,無(wú)法推廣到新數(shù)據(jù)

作者在論文中寫(xiě)道,在過(guò)去五年里,機(jī)器學(xué)習(xí)已經(jīng)成為一個(gè)實(shí)驗(yàn)領(lǐng)域。在深度學(xué)習(xí)的推動(dòng)下,大多數(shù)發(fā)表的論文都采用了同一種套路,那就是看一種新的方法在幾個(gè)關(guān)鍵基準(zhǔn)上性能有多少提升。換句話說(shuō),就是簡(jiǎn)單粗暴地對(duì)比數(shù)值,很少有人去解釋為什么。

而在對(duì)比數(shù)值的時(shí)候,大多數(shù)研究的評(píng)估都取決于少數(shù)幾個(gè)標(biāo)準(zhǔn)的基準(zhǔn),例如CIFAR-10、ImageNet或MuJoCo。不僅如此,由于Ground truth的數(shù)據(jù)分布一般很難得到,所以研究人員只能在單獨(dú)的測(cè)試集上評(píng)估模型的性能。

“現(xiàn)在,在整個(gè)算法和模型設(shè)計(jì)過(guò)程中,多次重復(fù)使用相同的測(cè)試集的做法已經(jīng)被普遍接受。盡管將新模型與以前的結(jié)果進(jìn)行比較是很自然的想法,但顯然目前的研究方法破壞了分類(lèi)器獨(dú)立于測(cè)試集這一關(guān)鍵假設(shè)?!?/p>

這種不匹配帶來(lái)了明顯的危害,因?yàn)檠芯咳藛T可以很容易地設(shè)計(jì)出只能在特定測(cè)試集上運(yùn)行良好,但實(shí)際上無(wú)法推廣到新數(shù)據(jù)的模型。

CIFAR-10可重復(fù)性實(shí)驗(yàn):VGG、ResNet等經(jīng)典模型精度普遍下降

為了審視這種現(xiàn)象造成的后果,研究人員對(duì)CIFAR-10以及相關(guān)分類(lèi)器做了再調(diào)查。研究的主要目標(biāo)是,衡量新進(jìn)的分類(lèi)器在泛化到來(lái)自相同分布的、未知新數(shù)據(jù)時(shí)能做得多好。

選擇標(biāo)準(zhǔn)CIFAR-10數(shù)據(jù)集,是因?yàn)樗该鞯膭?chuàng)建過(guò)程使其特別適合于這個(gè)任務(wù)。此外,CIFAR-10已經(jīng)成為近10年來(lái)研究的熱點(diǎn),在調(diào)查適應(yīng)性(adaptivity)是否導(dǎo)致過(guò)擬合這個(gè)問(wèn)題上,它是一個(gè)很好的測(cè)試用例。

在實(shí)驗(yàn)中,研究人員首先用新的、確定是模型沒(méi)有見(jiàn)過(guò)的大約2000幅圖像,制作了一個(gè)新的測(cè)試集,并將新測(cè)試集的子類(lèi)分布與原始 CIFAR-10 數(shù)據(jù)集仔細(xì)地做匹配,盡可能保持一致。

然后,在新測(cè)試集上評(píng)估了30個(gè)圖像分類(lèi)器的性能,包括經(jīng)典的VGG、ResNet,最近新提出的ResNeXt、PyramidNet、DenseNet,以及在ICLR 2018發(fā)布的Shake-Drop,這個(gè)Shake-Drop正則化方法結(jié)合以前的分類(lèi)器,取得了目前的state-of-art。

結(jié)果如下表所示。原始CIFAR-10測(cè)試集和新測(cè)試集的模型精度,Gap是兩者精度的差異。ΔRank表示排名的變化,比如“-2”意味著在新測(cè)試集中的排名下降了兩個(gè)位置。

由結(jié)果可知,新測(cè)試集上模型的精度相比原始測(cè)試集有明顯下降。例如,VGG和ResNet這兩個(gè)模型在原始數(shù)據(jù)集上準(zhǔn)確率為93%,而在新測(cè)試集上降為了85%左右。此外,作者還表示,他們發(fā)現(xiàn)現(xiàn)有測(cè)試集上模型的性能相比新測(cè)試集更加具有預(yù)測(cè)性。

對(duì)于出現(xiàn)這種結(jié)果的原因,作者設(shè)定了多個(gè)假設(shè)并一一進(jìn)行了討論,除了統(tǒng)計(jì)誤差、調(diào)參等之外,主要還是過(guò)擬合。

作者表示,他們的結(jié)果展現(xiàn)了當(dāng)前機(jī)器學(xué)習(xí)進(jìn)展令人意外的一面。盡管CIFAR-10測(cè)試集已經(jīng)被不斷適應(yīng)(adapting)了很多年,但這種趨勢(shì)并沒(méi)有停滯。表現(xiàn)最好的模型仍然是最近提出的Shake-Shake網(wǎng)絡(luò)(Cutout正則化)。而且,在新的測(cè)試集置上,Shake-Shake比標(biāo)準(zhǔn)ResNet的優(yōu)勢(shì)從4%增加到8%。這表明,瞄準(zhǔn)一個(gè)測(cè)試集猛攻的研究方法對(duì)過(guò)擬合而言是十分有效的。

同時(shí),這個(gè)結(jié)果也對(duì)當(dāng)前分類(lèi)器的魯棒性提出了質(zhì)疑。盡管新數(shù)據(jù)集只做了微小的改變(分布轉(zhuǎn)移),但現(xiàn)有的被廣泛使用的模型,分類(lèi)準(zhǔn)確性普遍顯著下降。例如,前面提到的VGG和ResNet的精度損失對(duì)應(yīng)于CIFAR-10的多年進(jìn)展。

作者特別指出,他們的實(shí)驗(yàn)引起的分布轉(zhuǎn)移(distributional shift)既不是對(duì)抗性的(adversarial),也不是不同數(shù)據(jù)源導(dǎo)致的結(jié)果。因此,即使在良性環(huán)境中,分布轉(zhuǎn)移也會(huì)帶來(lái)嚴(yán)峻的挑戰(zhàn),研究人員需要思考,目前的模型真正能泛化到什么程度。

機(jī)器學(xué)習(xí)研究也需要注意可重復(fù)性

Python Machine Learning 一書(shū)作者Sebastian Raschka評(píng)論這項(xiàng)研究認(rèn)為,它再次提醒機(jī)器學(xué)習(xí)研究人員注意測(cè)試集重復(fù)使用(以及違背獨(dú)立性)的問(wèn)題。

谷歌大腦研究科學(xué)家、Twitter賬戶hardmaru表示,對(duì)機(jī)器學(xué)習(xí)研究進(jìn)行可靠評(píng)估的方法十分重要。他期待見(jiàn)到有關(guān)文本和翻譯的類(lèi)似研究,并查看PTB,wikitext,enwik8,WMT'14 EN-FR,EN-DE等結(jié)構(gòu)如何從相同分布轉(zhuǎn)移到新的測(cè)試集。

不過(guò),hardmaru表示,如果在PTB上得到類(lèi)似的結(jié)果,那么對(duì)于深度學(xué)習(xí)研究界來(lái)說(shuō)實(shí)際上是好事,因?yàn)樵赑TB這個(gè)小數(shù)據(jù)集上進(jìn)行超級(jí)優(yōu)化的典型過(guò)程,確實(shí)會(huì)讓人發(fā)現(xiàn)泛化性能更好的新方法。

作者表示,未來(lái)實(shí)驗(yàn)應(yīng)該探索在其他數(shù)據(jù)集(例如ImageNet)和其他任務(wù)(如語(yǔ)言建模)上是否同樣對(duì)過(guò)擬合具有復(fù)原性。此外,我們應(yīng)該了解哪些自然發(fā)生的分布變化對(duì)圖像分類(lèi)器具有挑戰(zhàn)性。

為了真正理解泛化問(wèn)題,更多的研究應(yīng)該收集有洞察力的新數(shù)據(jù)并評(píng)估現(xiàn)有算法在這些數(shù)據(jù)上的性能表現(xiàn)。類(lèi)似于招募新參與者進(jìn)行醫(yī)學(xué)或心理學(xué)的可重復(fù)性實(shí)驗(yàn),機(jī)器學(xué)習(xí)研究也需要對(duì)模型性能的可重復(fù)多做研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • MIT
    MIT
    +關(guān)注

    關(guān)注

    3

    文章

    254

    瀏覽量

    25043
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    67

    文章

    8569

    瀏覽量

    137300

原文標(biāo)題:十年機(jī)器學(xué)習(xí)結(jié)果不可靠?伯克利&MIT研究質(zhì)疑了30個(gè)經(jīng)典模型

文章出處:【微信號(hào):worldofai,微信公眾號(hào):worldofai】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    機(jī)器學(xué)習(xí)中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    機(jī)器學(xué)習(xí)的世界里,句老話尤為貼切:“garbagein,garbageout”(輸入垃圾,輸出垃圾)。無(wú)論模型架構(gòu)先進(jìn)、算法精妙,數(shù)
    的頭像 發(fā)表于 04-24 15:48 ?132次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>中的數(shù)據(jù)質(zhì)量雙保障:從“驗(yàn)證”到“標(biāo)記”

    無(wú)線通信技術(shù)核心定位從 “速度競(jìng)賽” 轉(zhuǎn)向超高可靠

    景賦能:從消費(fèi)到工業(yè)的全面升級(jí) Wi-Fi 8的超高可靠性,讓無(wú)線連接深度滲透高要求場(chǎng)景: 工業(yè)自動(dòng)化 :支撐協(xié)作機(jī)器人、AGV等設(shè)備毫秒級(jí)低時(shí)延、零丟包通信,實(shí)現(xiàn)無(wú)線替代有線,助力柔性生產(chǎn)與無(wú)人
    發(fā)表于 04-23 17:31

    上海光機(jī)所在激光焊接過(guò)程監(jiān)測(cè)方面取得新進(jìn)展

    圖 1 用于熔透狀態(tài)分類(lèi)的模態(tài)機(jī)器學(xué)習(xí)框架(Fusion-XGBNet) 近日,中科院上海光機(jī)所高端光電裝備部激光智能制造技術(shù)研發(fā)中心楊上陸研究員團(tuán)隊(duì),在激光焊接過(guò)程監(jiān)測(cè)方面取得進(jìn)展
    的頭像 發(fā)表于 04-01 06:40 ?124次閱讀
    上海光機(jī)所在激光焊接過(guò)程監(jiān)測(cè)方面取得新<b class='flag-5'>進(jìn)展</b>

    芯光纜技術(shù)進(jìn)展與挑戰(zhàn)

    芯光纜作為光通信領(lǐng)域的一項(xiàng)前沿技術(shù),近年來(lái)取得了顯著進(jìn)展,不僅推動(dòng)了通信容量的飛躍,也為未來(lái)通信網(wǎng)絡(luò)的發(fā)展開(kāi)辟了新路徑。然而,任何技術(shù)的發(fā)展都不是一帆風(fēng)順的,芯光纜同樣面臨著諸多挑戰(zhàn)。 技術(shù)
    的頭像 發(fā)表于 03-16 09:56 ?302次閱讀

    智能體強(qiáng)化學(xué)習(xí)(MARL)核心概念與算法概覽

    訓(xùn)練單個(gè)RL智能體的過(guò)程非常簡(jiǎn)單,那么我們現(xiàn)在換一個(gè)場(chǎng)景,同時(shí)訓(xùn)練五個(gè)智能體,而且每個(gè)都有自己的目標(biāo)、只能看到部分信息,還能互相幫忙。這就是智能體強(qiáng)化學(xué)習(xí)
    的頭像 發(fā)表于 01-21 16:21 ?358次閱讀
    <b class='flag-5'>多</b>智能體強(qiáng)化<b class='flag-5'>學(xué)習(xí)</b>(MARL)核心概念與算法概覽

    機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T(mén)還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要
    的頭像 發(fā)表于 01-07 15:37 ?371次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>和深度<b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    Progress-Think框架賦能機(jī)器人首次實(shí)現(xiàn)語(yǔ)義進(jìn)展推理

    在視覺(jué)語(yǔ)言導(dǎo)航(VLN)中,機(jī)器人長(zhǎng)期缺乏一種關(guān)鍵能力:它能持續(xù)前進(jìn),卻無(wú)法判斷自己的任務(wù)推進(jìn)到了哪一步。導(dǎo)航在空間中不斷展開(kāi),畫(huà)面節(jié)節(jié)推進(jìn),但模型并不知道自己在自然語(yǔ)言指令里處于什么階段,因此容易漂移、兜圈,或做出難以解釋的決策。我們認(rèn)為,引入語(yǔ)義
    的頭像 發(fā)表于 12-03 09:27 ?477次閱讀
    Progress-Think框架賦能<b class='flag-5'>機(jī)器</b>人首次實(shí)現(xiàn)語(yǔ)義<b class='flag-5'>進(jìn)展</b>推理

    應(yīng)用光譜數(shù)字圖像區(qū)分苗期作物與雜草的研究進(jìn)展

    處理與機(jī)器學(xué)習(xí)算法,為自動(dòng)化、智能化的雜草管理提供了新思路。本文綜述該技術(shù)的研究現(xiàn)狀、核心方法、挑戰(zhàn)及未來(lái)發(fā)展方向。 技術(shù)原理與方法 1. 光譜成像技術(shù) 光譜成像(Multispe
    的頭像 發(fā)表于 10-21 15:25 ?504次閱讀

    光譜圖像顏色特征用于茶葉分類(lèi)的研究進(jìn)展

    光譜成像技術(shù)結(jié)合顏色特征分析為茶葉分類(lèi)提供了高效、非破壞性的解決方案。本文系統(tǒng)綜述了該技術(shù)的原理、方法、應(yīng)用案例及挑戰(zhàn),探討了其在茶葉品質(zhì)分級(jí)、品種識(shí)別和產(chǎn)地溯源中的研究進(jìn)展,并展望了未來(lái)發(fā)展方向
    的頭像 發(fā)表于 10-17 17:09 ?797次閱讀
    <b class='flag-5'>多</b>光譜圖像顏色特征用于茶葉分類(lèi)的研究<b class='flag-5'>進(jìn)展</b>

    上海光機(jī)所在波長(zhǎng)同步皮秒光纖激光器方面取得進(jìn)展

    圖1 實(shí)驗(yàn)裝置示意圖 近期,中國(guó)科學(xué)院上海光學(xué)精密機(jī)械研究所空天激光技術(shù)與系統(tǒng)部周佳琦研究員團(tuán)隊(duì),在波長(zhǎng)同步皮秒光纖激光器方面取得進(jìn)展。相關(guān)成果以“Synchronized
    的頭像 發(fā)表于 09-22 09:21 ?666次閱讀
    上海光機(jī)所在<b class='flag-5'>多</b>波長(zhǎng)同步皮秒光纖激光器方面取得<b class='flag-5'>進(jìn)展</b>

    集成摩川磁性編碼器的伺服電機(jī)與機(jī)器人關(guān)節(jié)設(shè)計(jì)創(chuàng)新

    起著決定性作用。今天,我們就來(lái)聊聊集成摩川磁性編碼器的伺服電機(jī)與機(jī)器人關(guān)節(jié)的設(shè)計(jì)創(chuàng)新,這可是機(jī)器人領(lǐng)域里的一項(xiàng)大突破!
    的頭像 發(fā)表于 08-28 18:23 ?981次閱讀

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無(wú)法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門(mén)陣列)作為一種靈活且高效的硬件加速平臺(tái)
    的頭像 發(fā)表于 07-16 15:34 ?3141次閱讀

    通過(guò)NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來(lái),這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個(gè)關(guān)鍵挑戰(zhàn):機(jī)器人需要大量的訓(xùn)練數(shù)據(jù)來(lái)掌握諸如組裝和檢查之類(lèi)的技能,而手動(dòng)演
    的頭像 發(fā)表于 07-14 11:49 ?1345次閱讀
    通過(guò)NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    聽(tīng)得見(jiàn)、想得通、做得到:移遠(yuǎn)通信攜手逐際動(dòng)力,發(fā)布Robrain AI機(jī)器人解決方案

    在具身智能加速進(jìn)化、機(jī)器人邁向自主交互的關(guān)鍵階段,“自主決策”能力與“模態(tài)感知”敏銳度,已成為衡量機(jī)器人智能化與商業(yè)價(jià)值的核心標(biāo)尺。 移遠(yuǎn)通信依托其在人工智能領(lǐng)域的深厚積淀與前沿研發(fā)
    發(fā)表于 06-19 10:28 ?1708次閱讀
    聽(tīng)得見(jiàn)、想得通、做得到:移遠(yuǎn)通信攜手逐際動(dòng)力,發(fā)布Robrain AI<b class='flag-5'>機(jī)器</b>人解決方案

    機(jī)器學(xué)習(xí)賦能的智能光子學(xué)器件系統(tǒng)研究與應(yīng)用

    騰訊會(huì)議---六月直播 1.機(jī)器學(xué)習(xí)賦能的智能光子學(xué)器件系統(tǒng)研究與應(yīng)用 2.COMSOL聲學(xué)物理場(chǎng)仿真技術(shù)與應(yīng)用 3.超表面逆向設(shè)計(jì)及前沿應(yīng)用(從基礎(chǔ)入門(mén)到論文復(fù)現(xiàn)) 4.智能光學(xué)計(jì)算成像技術(shù)
    的頭像 發(fā)表于 06-04 17:59 ?790次閱讀
    <b class='flag-5'>機(jī)器</b><b class='flag-5'>學(xué)習(xí)</b>賦能的智能光子學(xué)器件系統(tǒng)研究與應(yīng)用
    华亭县| 天祝| 西乌| 青田县| 虹口区| 隆尧县| 平凉市| 上饶市| 宝应县| 抚宁县| 九江县| 高雄市| 福贡县| 高碑店市| 灯塔市| 新巴尔虎左旗| 湖南省| 石楼县| 临澧县| 奇台县| 确山县| 肥乡县| 彩票| 海宁市| 云龙县| 措勤县| 遵义市| 平南县| 迭部县| 儋州市| 固镇县| 吉水县| 陵川县| 墨竹工卡县| 荔波县| 呼和浩特市| 老河口市| 六枝特区| 哈巴河县| 宣城市| 济源市|