日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么深度學(xué)習(xí)還沒有取代傳統(tǒng)計算機(jī)視覺技術(shù)?

新機(jī)器視覺 ? 來源:云棲社區(qū) ? 作者:云棲社區(qū) ? 2020-10-23 11:24 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文作者認(rèn)為,深度學(xué)習(xí)只是一種計算機(jī)視覺工具,而不是包治百病的良藥,不要因為流行就一味地使用它。傳統(tǒng)的計算機(jī)視覺技術(shù)仍然可以大顯身手,了解它們可以為你省去很多的時間和煩惱;并且掌握傳統(tǒng)計算機(jī)視覺確實可以讓你在深度學(xué)習(xí)方面做得更好。這是因為你可以更好地理解深度學(xué)習(xí)的內(nèi)部狀況,并可執(zhí)行預(yù)處理步驟改善深度學(xué)習(xí)結(jié)果。

本文的靈感同樣來自論壇中的一個常見問題:

深度學(xué)習(xí)已經(jīng)取代了傳統(tǒng)的計算機(jī)視覺嗎?

或是換種說法:

既然深度學(xué)習(xí)看起來如此有效,是否還有必要學(xué)習(xí)傳統(tǒng)的計算機(jī)視覺技術(shù)?

這個問題很好。深度學(xué)習(xí)確實給計算機(jī)視覺和人工智能領(lǐng)域帶來了革命性的突破。許多曾經(jīng)看似困難的問題,現(xiàn)在機(jī)器可以比解決的比人類還好。圖像分類就是最好的印證。確實,如從前所述,深度學(xué)習(xí)有責(zé)任將計算機(jī)視覺納入行業(yè)版圖。

但深度學(xué)習(xí)仍然只是計算機(jī)視覺的一個工具,且顯然不是解決所有問題的靈丹妙藥。因此,本文會對此進(jìn)行詳細(xì)闡述。也就是說,我將說明傳統(tǒng)的計算機(jī)視覺技術(shù)為何仍十分有用,值得我們繼續(xù)學(xué)習(xí)并傳授下去。

本文分為以下幾個部分/論點:

深度學(xué)習(xí)需要大數(shù)據(jù)

深度學(xué)習(xí)有時會做過了頭

傳統(tǒng)計算機(jī)視覺將會提升你的深度學(xué)習(xí)水平

進(jìn)入正文之前,我認(rèn)為有必要詳細(xì)解釋一下什么是「傳統(tǒng)計算機(jī)視覺」,什么是深度學(xué)習(xí),及其革命性。

背景知識

在深度學(xué)習(xí)出現(xiàn)以前,如果你有一項諸如圖像分類的工作,你會進(jìn)行一步叫做「特征提取」的處理。所謂「特征」就是圖像中「有趣的」、描述性的、或是提供信息的小部分。你會應(yīng)用我在本文中稱之為的「傳統(tǒng)計算機(jī)視覺技術(shù)」的組合來尋找這些特征,包括邊緣檢測、角點檢測、對象檢測等等。

在使用這些與特征提取和圖像分類相關(guān)的技術(shù)時,會從一類對象(例如:椅子、馬等等)的圖像中提取出盡可能多的特征,并將其視為這類對象的「定義」(稱作「詞袋」)。接下來你要在其它圖像中搜索這些「定義」。如果在另一個圖像中存在著詞袋中相當(dāng)一部分的特征,那么這個圖像就被歸為包含那個特定對象(如椅子、馬等等)的分類。

這種圖像分類的特征提取方法的難點在于你必須在每張圖像中選擇尋找哪些特征。隨著你試圖區(qū)分的類別數(shù)目開始增長,比如說超過 10 或 20,這就會變得非常麻煩甚至難以實現(xiàn)。你要尋找角點?邊緣?還是紋理信息?不同類別的對象最好要用不同種類型的特征來描述。如果你選擇使用很多的特征,你就不得不處理海量的參數(shù),而且還需要自己來微調(diào)。

深度學(xué)習(xí)引入了「端到端學(xué)習(xí)」這一概念,(簡而言之)讓機(jī)器在每個特定類別的對象中學(xué)習(xí)尋找特征,即最具描述性、最突出的特征。換句話說,讓神經(jīng)網(wǎng)絡(luò)去發(fā)現(xiàn)各種類型圖像中的潛在模式。

因此,借助端到端學(xué)習(xí),你不再需要手動決定采用哪種傳統(tǒng)機(jī)器視覺技術(shù)來描述特征。機(jī)器為你做好了這一切?!哆B線》雜志如此寫道:

舉例來說,如果你想教會一個 [深度] 神經(jīng)網(wǎng)絡(luò)識別一只貓,你不必告訴它去尋找胡須、耳朵、毛或是眼睛。你只需展示給它成千上萬的貓的圖像,它自然會解決這一問題。如果它總是會將狐貍誤認(rèn)為是貓,你也不用重寫代碼。你只需對它繼續(xù)進(jìn)行訓(xùn)練。

下圖描述了特征提?。ㄊ褂脗鹘y(tǒng)計算機(jī)視覺)和端到端學(xué)習(xí)之間的這種區(qū)別:

以上就是背景介紹?,F(xiàn)在接著討論為什么傳統(tǒng)計算機(jī)視覺仍然必不可少,而且學(xué)習(xí)它仍大有裨益。

深度學(xué)習(xí)需要大量數(shù)據(jù)

首先,深度學(xué)習(xí)需要數(shù)據(jù),許許多多的數(shù)據(jù)。前文提到過的著名圖像分類模型的訓(xùn)練都基于龐大的數(shù)據(jù)集。排名前三的訓(xùn)練數(shù)據(jù)集分別是:

ImageNet——150 萬圖像,1000 個對象分類/類別;

COCO——250 萬圖像,91 個對象分類;

PASCAL VOC——50 萬圖像,20 個對象分類。

但是一個訓(xùn)練不良的模型在你的訓(xùn)練數(shù)據(jù)之外很可能表現(xiàn)糟糕,因為機(jī)器并沒有對于問題的洞察力,也就不能在沒看到數(shù)據(jù)的情況下進(jìn)行概括歸納。而且對你來說查看訓(xùn)練模型內(nèi)部并進(jìn)行手動調(diào)整又太過困難,因為一個深度學(xué)習(xí)模型內(nèi)部擁有數(shù)以百萬計的參數(shù)——每個參數(shù)在訓(xùn)練期間都會被調(diào)整。某種程度上說,一個深度學(xué)習(xí)模型就是一個黑箱。

傳統(tǒng)的計算機(jī)視覺完全透明,允許你更好地評估判斷你的解決方案是否在訓(xùn)練環(huán)境之外依然有效。你對問題的深入見解可以放進(jìn)你的算法之中。并且如果任何地方出現(xiàn)故障,你也可以更輕易地弄清楚什么需要調(diào)整,在哪里調(diào)整。

深度學(xué)習(xí)有時做過了頭

這大概是我最喜歡的支持研究傳統(tǒng)計算機(jī)視覺技術(shù)的理由。

訓(xùn)練一個深度神經(jīng)網(wǎng)絡(luò)需要很長的時間。你需要專門的硬件(例如高性能 GPU)訓(xùn)練最新、最先進(jìn)的圖像分類模型。你想在自己還不錯的筆記本上訓(xùn)練?去度個一周的假吧,等你回來的時候訓(xùn)練很可能仍未完成。

此外,如果你的訓(xùn)練模型表現(xiàn)不佳呢?你不得不返回原點,用不同的訓(xùn)練參數(shù)重做全部工作。這一過程可能會重復(fù)數(shù)百次。

但有時候所有這些完全沒必要。因為傳統(tǒng)計算機(jī)視覺技術(shù)可以比深度學(xué)習(xí)更有效率地解決問題,而且使用的代碼更少。例如,我曾經(jīng)參與的一個項目是檢查每個通過傳送帶的罐子里是否有一個紅勺子?,F(xiàn)在你可以通過前文敘述的曠日持久的過程來訓(xùn)練一個深度神經(jīng)網(wǎng)絡(luò)去檢測勺子,或者你也可以寫一個簡單的以紅色為閾值的算法(將任何帶有一定范圍紅色的像素都標(biāo)記為白色,所有其它的像素標(biāo)記為黑色),然后計算有多少白色的像素。簡簡單單,一個小時就可以搞定!

掌握傳統(tǒng)的計算機(jī)視覺技術(shù)可能會為你節(jié)省大量的時間并減少不必要的煩惱。

傳統(tǒng)計算機(jī)視覺會提升你的深度學(xué)習(xí)技巧

理解傳統(tǒng)的計算機(jī)視覺實際上能幫你在深度學(xué)習(xí)上做得更好。

舉例來說,計算機(jī)視覺領(lǐng)域最為普遍使用的神經(jīng)網(wǎng)絡(luò)是卷積神經(jīng)網(wǎng)絡(luò)。但什么是卷積?卷積事實上是一種被廣泛使用的圖像處理技術(shù)(比如,索貝爾邊緣檢測)。了解這一點可以幫助你理解神經(jīng)網(wǎng)絡(luò)內(nèi)部究竟發(fā)生了什么,從而進(jìn)行設(shè)計和微調(diào)以更好地解決你的問題。

還有一件事叫做預(yù)處理。你輸入給模型的數(shù)據(jù)往往要經(jīng)過這種處理,以便為接下來的訓(xùn)練做準(zhǔn)備。這些預(yù)處理步驟主要是通過傳統(tǒng)的計算機(jī)視覺技術(shù)完成的。例如,如果你沒有足夠的訓(xùn)練數(shù)據(jù),你可以進(jìn)行一個叫做數(shù)據(jù)增強(qiáng)的處理。數(shù)據(jù)增強(qiáng)是指對你訓(xùn)練數(shù)據(jù)集中的圖像進(jìn)行隨機(jī)的旋轉(zhuǎn)、移動、裁剪等,從而創(chuàng)造出「新」圖像。通過執(zhí)行這些計算機(jī)視覺操作,可以極大地增加你的訓(xùn)練數(shù)據(jù)量。

結(jié)論

本文闡述了為什么深度學(xué)習(xí)還沒有取代傳統(tǒng)計算機(jī)視覺技術(shù),以及后者仍值得學(xué)習(xí)和傳授。首先,本文將目光放在了深度學(xué)習(xí)往往需要大量數(shù)據(jù)才能表現(xiàn)良好這一問題上。有時并不具備大量數(shù)據(jù),而傳統(tǒng)計算機(jī)視覺在這種情況下可作為一種替代方案。第二,深度學(xué)習(xí)針對特定的任務(wù)偶爾會做過頭。在這些任務(wù)中,標(biāo)準(zhǔn)的計算機(jī)視覺比起深度學(xué)習(xí)可以更為高效地解決問題,并且使用更少的代碼。第三,掌握傳統(tǒng)計算機(jī)視覺確實可以讓你在深度學(xué)習(xí)方面做得更好。這是因為你可以更好地理解深度學(xué)習(xí)的內(nèi)部狀況,并可執(zhí)行預(yù)處理步驟改善深度學(xué)習(xí)結(jié)果。

總而言之,深度學(xué)習(xí)只是一種計算機(jī)視覺的工具,而不是包治百病的良藥。不要因為流行就一味地使用它。
責(zé)任編輯人:CC

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴

原文標(biāo)題:觀點 | 為什么深度學(xué)習(xí)仍未取代傳統(tǒng)的計算機(jī)視覺技術(shù)?

文章出處:【微信號:vision263com,微信公眾號:新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Renesas 3858 組單芯片 8 位 CMOS 微計算機(jī)深度解析

    Renesas 3858 組單芯片 8 位 CMOS 微計算機(jī)深度解析 在電子設(shè)備不斷發(fā)展的今天,微計算機(jī)作為核心部件,其性能和特性對于整個系統(tǒng)的運(yùn)行起著至關(guān)重要的作用。今天我們就來深入探討一下
    的頭像 發(fā)表于 04-13 15:00 ?165次閱讀

    計算機(jī)專業(yè)408考研科目

    408 跨考零基礎(chǔ):三個月入門到精通路線 站在2026年的節(jié)點回望,計算機(jī)考研408(計算機(jī)學(xué)科專業(yè)基礎(chǔ)綜合)早已超越了單純的知識點考核,它更像是一場對邏輯思維與系統(tǒng)觀的深度洗禮。對于跨考且零基
    發(fā)表于 04-11 16:44

    傳音相關(guān)研究成果入選計算機(jī)視覺頂會CVPR 2026

    (Mohamed bin Zayed University of Artificial Intelligence,簡稱MBZUAI)聯(lián)合開展的“拍照解題”項目研究取得重要進(jìn)展,相關(guān)成果論文已被計算機(jī)視覺領(lǐng)域的國際頂級學(xué)術(shù)會議CVPR 2026正式錄用。
    的頭像 發(fā)表于 04-03 17:45 ?2983次閱讀
    傳音相關(guān)研究成果入選<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>頂會CVPR 2026

    上海計算機(jī)視覺企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技

    12月5日,由中國圖象圖形學(xué)學(xué)會青年工作委員會(下簡稱“青工委”)、上海市計算機(jī)學(xué)會計算機(jī)視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機(jī)
    的頭像 發(fā)表于 12-16 15:39 ?756次閱讀

    【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實戰(zhàn)課(11大系列課程,共5000+分鐘)

    ,形成\"傳統(tǒng)視覺算法→深度學(xué)習(xí)建模→工業(yè)級部署\"的完整技術(shù)鏈,幫助學(xué)員掌握從0到1搭建缺陷檢測系統(tǒng)的能力,響應(yīng)制造業(yè)\"提質(zhì)降本增效\"
    發(fā)表于 12-04 09:28

    【團(tuán)購】獨(dú)家全套珍藏!龍哥LabVIEW視覺深度學(xué)習(xí)實戰(zhàn)課程(11大系列課程,共5000+分鐘)

    ,形成\"傳統(tǒng)視覺算法→深度學(xué)習(xí)建?!I(yè)級部署\"的完整技術(shù)鏈,幫助學(xué)員掌握從0到1搭建缺陷檢測系統(tǒng)的能力,響應(yīng)制造業(yè)\"提質(zhì)降本增效\"
    發(fā)表于 12-03 13:50

    使用代理式AI激活傳統(tǒng)計算機(jī)視覺系統(tǒng)的三種方法

    當(dāng)前的計算機(jī)視覺系統(tǒng)擅長于識別物理空間與流程中的事件,卻難以詮釋場景細(xì)節(jié)及其意義,也無法推理后續(xù)可能發(fā)生的情況。
    的頭像 發(fā)表于 12-01 09:44 ?796次閱讀

    2025中國計算機(jī)大會DPU技術(shù)論壇成功舉辦

    近日,備受矚目的第22屆中國計算機(jī)大會(CNCC2025)在哈爾濱開幕。本屆大會注冊人數(shù)突破1.2萬人,匯聚了來自全球計算機(jī)領(lǐng)域的頂尖學(xué)者、產(chǎn)業(yè)領(lǐng)袖、青年學(xué)子及國際組織代表。大會以“數(shù)智賦能、無限可能”為主題,旨在深度探討數(shù)字智
    的頭像 發(fā)表于 11-02 09:29 ?916次閱讀

    STM32計算機(jī)視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強(qiáng)大的硬件集,可處理多種計算機(jī)視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?1670次閱讀
    STM32<b class='flag-5'>計算機(jī)</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊<b class='flag-5'>技術(shù)</b>解析

    如何在機(jī)器視覺中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實的編程技能才能真正掌握并合理使用這項技術(shù)。事實上,這種印象忽視了該技術(shù)為機(jī)器視覺(乃至生產(chǎn)自動化)帶來的潛力,因為深度
    的頭像 發(fā)表于 09-10 17:38 ?1074次閱讀
    如何在機(jī)器<b class='flag-5'>視覺</b>中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    自動駕駛中Transformer大模型會取代深度學(xué)習(xí)嗎?

    [首發(fā)于智駕最前沿微信公眾號]近年來,隨著ChatGPT、Claude、文心一言等大語言模型在生成文本、對話交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學(xué)習(xí)
    的頭像 發(fā)表于 08-13 09:15 ?4392次閱讀
    自動駕駛中Transformer大模型會<b class='flag-5'>取代</b><b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>嗎?

    易控智駕榮獲計算機(jī)視覺頂會CVPR 2025認(rèn)可

    近日,2025年國際計算機(jī)視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1396次閱讀

    自動化計算機(jī)經(jīng)過加固后有什么好處?

    -40℃的寒冷環(huán)境中運(yùn)行?C和溫度達(dá)到85℃的灼熱環(huán)境,這要?dú)w功于此類系統(tǒng)中使用的寬溫度組件和被動冷卻技術(shù)。2.抗沖擊和振動自動化計算機(jī)是工業(yè)級計算機(jī),其設(shè)計和制造可
    的頭像 發(fā)表于 07-21 16:44 ?776次閱讀
    自動化<b class='flag-5'>計算機(jī)</b>經(jīng)過加固后有什么好處?

    工業(yè)計算機(jī)與商用計算機(jī)的區(qū)別有哪些

    工業(yè)計算機(jī)是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機(jī)器人操作。其特點包括無風(fēng)扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)自動化場景中
    的頭像 發(fā)表于 07-10 16:36 ?940次閱讀
    工業(yè)<b class='flag-5'>計算機(jī)</b>與商用<b class='flag-5'>計算機(jī)</b>的區(qū)別有哪些

    利用邊緣計算和工業(yè)計算機(jī)實現(xiàn)智能視頻分析

    IVA的好處、實際部署應(yīng)用程序以及工業(yè)計算機(jī)如何實現(xiàn)這些解決方案。一、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復(fù)雜的計算機(jī)視覺,通常與卷積神經(jīng)網(wǎng)
    的頭像 發(fā)表于 05-16 14:37 ?1006次閱讀
    利用邊緣<b class='flag-5'>計算</b>和工業(yè)<b class='flag-5'>計算機(jī)</b>實現(xiàn)智能視頻分析
    榆中县| 南平市| 西藏| 叶城县| 茶陵县| 昭平县| 南澳县| 伊通| 鹤壁市| 海盐县| 大姚县| 衡山县| 清水河县| 天等县| 岐山县| 固阳县| 祥云县| 宁河县| 建湖县| 丘北县| 岐山县| 武威市| 瓮安县| 牟定县| 兴业县| 克什克腾旗| 元氏县| 新宾| 昂仁县| 和平县| 开远市| 宜宾市| 峡江县| 五寨县| 县级市| 淄博市| 玉环县| 武鸣县| 萨迦县| 搜索| 包头市|