日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

經(jīng)典圖像分類算法AlexNet介紹

新機(jī)器視覺 ? 來源:智能計(jì)算系統(tǒng) ? 作者:智能計(jì)算系統(tǒng) ? 2022-04-06 14:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本期開小灶Heyro將帶領(lǐng)大家進(jìn)入下一趟旅程——基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法講解,從而幫助大家了解在卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)下衍生出的被用于圖像分類的經(jīng)典算法。

在了解圖像分類算法以前,我們先來了解“何為圖像分類”。

圖像分類的核心是從給定的分類集合中給圖像分配一個(gè)標(biāo)簽的任務(wù)。簡言之,我們需要對(duì)一個(gè)輸入圖像進(jìn)行分析后返回一個(gè)對(duì)應(yīng)的分類標(biāo)簽,標(biāo)簽來自預(yù)先定義的可能類別集。圖像分類的任務(wù)即為正確給出輸入圖像的類別或輸出不同類別的概率。例如,我們先假設(shè)一個(gè)含有可能類別的類別集:

Categories = {cat, dog, fox}

然后,我們向分類系統(tǒng)提供一張狐貍?cè)膱D片。

經(jīng)過分類系統(tǒng)的處理,最終輸出可以是單一標(biāo)簽dog,也可以是基于概率的多個(gè)標(biāo)簽,例如cat:1%, dog:94%,fox:5% 。

計(jì)算機(jī)并不能像人類一樣快速通過視覺系統(tǒng)識(shí)別出圖像信息的語義。對(duì)于計(jì)算機(jī)而言,RGB圖像是由一個(gè)個(gè)像素?cái)?shù)值構(gòu)成的高維矩陣(張量)。計(jì)算機(jī)識(shí)別圖像的任務(wù)即尋找一個(gè)函數(shù)關(guān)系,該函數(shù)可將高維矩陣信息映射到一個(gè)具體的類別標(biāo)簽中。利用計(jì)算機(jī)實(shí)現(xiàn)圖像分類目的過程隨即衍生出圖像分類算法。

圖像分類算法的起源——神經(jīng)認(rèn)知機(jī)

傳統(tǒng)的圖像識(shí)別模型一般包括:底層特征學(xué)習(xí)>特征編碼>空間約束>分類器設(shè)計(jì)>模型融合等幾個(gè)流程。

2012年Alex Krizhevsky提出的CNN(卷積神經(jīng)網(wǎng)絡(luò))模型在ImageNet大規(guī)模視覺識(shí)別比賽(ILSVRC)中脫穎而出,其效果大大超越了傳統(tǒng)的圖像識(shí)別方法,該模型被稱為AlexNet。

基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法起源最早可追溯到日本學(xué)者福島邦彥提出的neocognition(神經(jīng)認(rèn)知機(jī))神經(jīng)網(wǎng)絡(luò)模型。

福島邦彥于1978年至1984年研制了用于手寫字母識(shí)別的多層自組織神經(jīng)網(wǎng)絡(luò)——認(rèn)知機(jī)。福島邦彥在認(rèn)知機(jī)中引入了最大值檢出等概念。簡言之,當(dāng)網(wǎng)格中某種神經(jīng)元損壞時(shí),該神經(jīng)元立即可由其他神經(jīng)元來代替。由此一來,認(rèn)知機(jī)就具有較好的容錯(cuò)能力。

但是,認(rèn)知機(jī)的網(wǎng)絡(luò)較為復(fù)雜,它對(duì)輸入的大小變換及平移、旋轉(zhuǎn)等變化并不敏感。雖然它能夠識(shí)別復(fù)雜的文字,但卻需要大量的處理單元和連接,這使得其硬件實(shí)現(xiàn)較為困難。

而福島邦彥在1980年提出的“神經(jīng)認(rèn)知機(jī)”神經(jīng)網(wǎng)絡(luò)模型卻能夠很好地應(yīng)對(duì)以上問題。

該模型借鑒了生物的視覺神經(jīng)系統(tǒng)。它對(duì)模式信號(hào)的識(shí)別優(yōu)于認(rèn)知機(jī)。無論輸入信號(hào)發(fā)生變換、失真,抑或被改變大小等,神經(jīng)認(rèn)知機(jī)都能對(duì)輸入信號(hào)進(jìn)行處理。但是,該模型被提出后一直未受到較大關(guān)注,直至AlexNet在ILSVRC中大獲全勝,卷積神經(jīng)網(wǎng)絡(luò)的潛力才為業(yè)界所認(rèn)知。

深度學(xué)習(xí)算法

自AlexNet之后,深度學(xué)習(xí)的發(fā)展極為迅速,網(wǎng)絡(luò)深度也在不斷地快速增長,隨后出現(xiàn)了VGG(19層)、GoogleNet(22層)、ResNet(152層),以及SENet(252層)等深度學(xué)習(xí)算法。

隨著模型深度和結(jié)構(gòu)設(shè)計(jì)的發(fā)展,ImageNet分類的Top-5錯(cuò)誤率也越來越低。在ImageNet上1000種物體的分類中,ResNet的Top-5錯(cuò)誤率僅為3.57%。在同樣的數(shù)據(jù)集上,人眼的識(shí)別錯(cuò)誤率約為5.1%,換言之,目前深度學(xué)習(xí)模型的識(shí)別能力已經(jīng)超過了人眼。

在卷積神經(jīng)網(wǎng)絡(luò)的歷史上,比較有里程碑意義的算法包括AlexNet、VGG、Inception (GoogleNet是Inception系列中的一員),以及ResNet。

在本期開小灶中,我們將首先為大家介紹經(jīng)典圖像分類算法AlexNet。

AlexNet 網(wǎng)絡(luò)結(jié)構(gòu)

作為G. Hinton代表作的AlexNet是深度學(xué)習(xí)領(lǐng)域最重要的成果之一。下面讓我們一起從左到右依次認(rèn)識(shí)這個(gè)結(jié)構(gòu)。

在AlexNet網(wǎng)絡(luò)結(jié)構(gòu)(如下圖所示)中,輸入為一個(gè)224×224大小的RGB圖像。

經(jīng)典圖像分類算法AlexNet介紹

AlexNet網(wǎng)絡(luò)結(jié)構(gòu)

第一層卷積,用48個(gè)11×11×3的卷積核計(jì)算出48個(gè)55×55大小的特征圖,用另外48個(gè)11×11×3的卷積核計(jì)算出另外48個(gè)55×55大小的特征圖,這兩個(gè)分支的卷積步長都是4,通過卷積把圖像的大小從224′224減小為55×55。第一層卷積之后,進(jìn)行局部響應(yīng)歸一化 (LRN) 以及步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為27×27。

第二層卷積,用兩組各128個(gè)5×5×48的卷積核對(duì)兩組輸入的特征圖分別進(jìn)行卷積處理,輸出兩組各128個(gè)27×27的特征圖。第二層卷積之后,做局部響應(yīng)歸一化和步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為13×13。

第三層卷積,將兩組特征圖合為一組。采用192個(gè)3×3×256的卷積核對(duì)所有輸入特征圖做卷積運(yùn)算,再用另外192個(gè)3×3×256的卷積核對(duì)所有輸入特征圖做卷積運(yùn)算,輸出兩組各192個(gè)13×13的特征圖。

第四層卷積,對(duì)兩組輸入特征圖分別用192個(gè)3×3×192的卷積核做卷積運(yùn)算。

第五層卷積,對(duì)兩組輸入特征圖分別用128個(gè)3×3×192的卷積核做卷積運(yùn)算。第五層卷積之后,做步長為2、池化窗口為3×3的最大池化,池化輸出的特征圖大小為6×6。

第六層和第七層的全連接層都有兩組神經(jīng)元(每組2048個(gè)神經(jīng)元)。

第八層的全連接層輸出1000種特征并送到softmax中,softmax輸出分類的概率。

AlexNet 技術(shù)創(chuàng)新點(diǎn)

相較于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)而言,AlexNet的技術(shù)創(chuàng)新體現(xiàn)在四個(gè)方面。

其一為Dropout(隨機(jī)失活)。Dropout于2012年由G. Hinton等人提出。該方法通過隨機(jī)舍棄部分隱層節(jié)點(diǎn)來緩解過擬合。目前,Dropout已經(jīng)成為深度學(xué)習(xí)訓(xùn)練常用的技巧之一。

使用Dropout進(jìn)行模型訓(xùn)練的過程為:a. 以一定概率隨機(jī)舍棄部分隱層神經(jīng)元,即將這些神經(jīng)元的輸出設(shè)置為0;b.一小批訓(xùn)練樣本經(jīng)過正向傳播后,在反向傳播更新權(quán)重時(shí)不更新其中與被舍棄神經(jīng)元相連的權(quán)重;c. 恢復(fù)被刪除神經(jīng)元,并輸入另一小批訓(xùn)練樣本;d. 重復(fù)步驟a ~ c ,直到處理完所有訓(xùn)練樣本。

其二為LRN(局部響應(yīng)歸一化)。LRN對(duì)同一層的多個(gè)輸入特征圖在每個(gè)位置上做局部歸一化,從而提升高響應(yīng)特征并抑制低響應(yīng)特征。LRN的輸入是卷積層輸出特征圖經(jīng)過ReLU激活函數(shù)后的輸出。但近年來業(yè)界發(fā)現(xiàn)LRN層作用有限,因此目前使用LRN的研究并不多。

其三是Max Pooling(最大池化)。最大池化可以避免特征被平均池化模糊,從而提高特征的魯棒性。在AlexNet之前,很多研究用平均池化;從AlexNet開始,業(yè)界公認(rèn)最大池化的效果比較好。

其四是ReLU激活函數(shù)。在AlexNet之前,常用的激活函數(shù)是sigmoid和tanh。而ReLU函數(shù)很簡單,我們?cè)谥暗拈_小灶中為大家講解過ReLU激活函數(shù)的特征,即輸入小于0時(shí)輸出0,輸入大于0時(shí)輸出等于輸入??此品浅:唵蔚腞eLU函數(shù)卻在訓(xùn)練時(shí)帶來了非常好的效果,這是業(yè)界在AlexNet之前未曾料想到的。AlexNet在卷積層和全連接層的輸出均使用ReLU激活函數(shù),從而有效提高訓(xùn)練時(shí)的收斂速度。

AlexNet通過把看似平凡的技術(shù)組合起來取得了驚人的顯著效果。

正是由于AlexNet采用了深層神經(jīng)網(wǎng)絡(luò)的訓(xùn)練思路,并輔以ReLU函數(shù)、Dropout及數(shù)據(jù)擴(kuò)充等操作,使得圖像識(shí)別真正走向了與深度學(xué)習(xí)結(jié)合發(fā)展的方向。

原文標(biāo)題:基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法講解

文章出處:【微信公眾號(hào):機(jī)器視覺智能檢測】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4844

    瀏覽量

    108209
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4810

    瀏覽量

    98610

原文標(biāo)題:基于卷積神經(jīng)網(wǎng)絡(luò)的圖像分類算法講解

文章出處:【微信號(hào):vision263com,微信公眾號(hào):新機(jī)器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    新一代單目標(biāo) AI 跟蹤算法,解決典型困難場景下的跟蹤穩(wěn)定性問題

    作為具備算法定制開發(fā)的公司,成都慧視之前的目標(biāo)跟蹤算法均是采用相關(guān)跟蹤,通過在線更新分類模型來實(shí)現(xiàn)目標(biāo)的定位跟蹤。即以當(dāng)前幀目標(biāo)區(qū)域?yàn)檎龢颖?,背景區(qū)域?yàn)樨?fù)樣本,基于機(jī)器學(xué)習(xí)或其他方法訓(xùn)練分類
    的頭像 發(fā)表于 03-17 17:59 ?710次閱讀
    新一代單目標(biāo) AI 跟蹤<b class='flag-5'>算法</b>,解決典型困難場景下的跟蹤穩(wěn)定性問題

    紅外圖像秒變高清!超分算法如何讓模糊熱成像“纖毫畢現(xiàn)”

    在深夜的森林中,消防員手持熱成像儀尋找被困者,屏幕上的模糊熱斑卻難以精準(zhǔn)定位;在電力巡檢中,工程師通過紅外鏡頭檢測設(shè)備溫度異常,但低分辨率圖像讓微小故障隱患悄然溜走……這些場景曾因紅外熱成像技術(shù)的分辨率瓶頸而受到困擾。如今,超分技術(shù)已通過算法突破物理限制,讓模糊的紅外
    的頭像 發(fā)表于 02-02 10:35 ?577次閱讀
    紅外<b class='flag-5'>圖像</b>秒變高清!超分<b class='flag-5'>算法</b>如何讓模糊熱成像“纖毫畢現(xiàn)”

    圖像采集卡分類、接口與性能指標(biāo)詳解

    圖像采集卡是機(jī)器視覺、工業(yè)檢測、安防監(jiān)控、醫(yī)療影像等領(lǐng)域的核心硬件,核心作用是將相機(jī)等圖像源輸出的模擬/數(shù)字信號(hào)轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別、處理的數(shù)字圖像數(shù)據(jù),同時(shí)完成信號(hào)同步、緩存、傳輸?shù)汝P(guān)鍵操作,其
    的頭像 發(fā)表于 01-29 16:55 ?732次閱讀
    <b class='flag-5'>圖像</b>采集卡<b class='flag-5'>分類</b>、接口與性能指標(biāo)詳解

    PID控制的算法

    當(dāng)中,PID控制算法又是最簡單,最能體現(xiàn)反饋思想的控制算法,可謂經(jīng)典中的經(jīng)典。經(jīng)典的未必是復(fù)雜的,經(jīng)典
    發(fā)表于 01-23 08:18

    EspeedGrab圖像采集軟件介紹(Cameralink轉(zhuǎn)USB采集)

    /14/16; 黑白、彩色、Bayer;可見、紅外、紫外;線陣、面陣; 2 圖像存儲(chǔ)錄制 逐幀、跳幀、定時(shí)等多模式存儲(chǔ); BMP、JPEG、RAW、AVI等,視頻或者圖片皆可以。 3 特殊格式支持
    發(fā)表于 12-23 17:26

    基于級(jí)聯(lián)分類器的人臉檢測基本原理

    本次分享的內(nèi)容是基于級(jí)聯(lián)分類器的人臉檢測基本原理 1) 人臉檢測概述 關(guān)于人臉檢測算法,目前主流方法分為兩類,一類是基于知識(shí),主要方法包括模板匹配,人臉特征,形狀和邊緣,紋理特征,顏色特征
    發(fā)表于 10-30 06:14

    AES加解密算法邏輯實(shí)現(xiàn)及其在蜂鳥E203SoC上的應(yīng)用介紹

    這次分享我們會(huì)簡要介紹AES加解密算法的邏輯實(shí)現(xiàn),以及如何將AES算法做成硬件協(xié)處理器集成在蜂鳥E203 SoC上。 AES算法介紹 AE
    發(fā)表于 10-29 07:29

    使用Otsu閾值算法將灰度圖像二值化

    Otsu 算法是由日本學(xué)者OTSU于1979年提出的一種對(duì)圖像進(jìn)行二值化的高效算法,又稱“最大類間方差法”。當(dāng)我們對(duì)一個(gè)圖象進(jìn)行二值化操作的時(shí)候,需要根據(jù)一項(xiàng)灰度閾值來判決每個(gè)像素點(diǎn)應(yīng)該被視作純黑
    發(fā)表于 10-28 06:49

    RISC-V 算法原理及串口通信

    具體方法 算法原理: 由于場景中的目標(biāo)在運(yùn)動(dòng),目標(biāo)的影像在不同圖像幀中的位置不同。該類算法對(duì)時(shí)間上連續(xù)的兩幀或三幀圖像進(jìn)行差分運(yùn)算,不同幀對(duì)應(yīng)的像素點(diǎn)相減,判斷灰度差的絕對(duì)值,當(dāng)絕
    發(fā)表于 10-28 06:16

    國密系列算法簡介及SM4算法原理介紹

    一、 國密系列算法簡介 國家商用密碼算法(簡稱國密/商密算法),是由我國國家密碼管理局制定并公布的密碼算法標(biāo)準(zhǔn)。其分類1所示: 圖1
    發(fā)表于 10-24 08:25

    加密算法的應(yīng)用

    加密是一種保護(hù)信息安全的重要手段,近年來隨著信息技術(shù)的發(fā)展,加密技術(shù)的應(yīng)用越來越廣泛。本文將介紹加密算法的發(fā)展、含義、分類及應(yīng)用場景。 1. 加密算法的發(fā)展 加密
    發(fā)表于 10-24 08:03

    基于FPGA的CLAHE圖像增強(qiáng)算法設(shè)計(jì)

    CLAHE圖像增強(qiáng)算法又稱為對(duì)比度有限的自適應(yīng)直方圖均衡算法,其算法原理是通過有限的調(diào)整圖像局部對(duì)比度來增強(qiáng)有效信號(hào)和抑制噪聲信號(hào)。
    的頭像 發(fā)表于 10-15 10:14 ?825次閱讀
    基于FPGA的CLAHE<b class='flag-5'>圖像</b>增強(qiáng)<b class='flag-5'>算法</b>設(shè)計(jì)

    迅為iTOP-RK3568人工智能開發(fā)板mobilenet圖像分類模型推理測試

    想快速驗(yàn)證MobileNet圖像分類模型的實(shí)際運(yùn)行效果?迅為iTOP-RK3568人工智能開發(fā)板,讓模型推理測試高效又省心。
    的頭像 發(fā)表于 08-28 15:53 ?1580次閱讀
    迅為iTOP-RK3568人工智能開發(fā)板mobilenet<b class='flag-5'>圖像</b><b class='flag-5'>分類</b>模型推理測試

    產(chǎn)品分類管理API接口

    ? 產(chǎn)品分類管理是現(xiàn)代電商、庫存系統(tǒng)和內(nèi)容管理平臺(tái)的核心功能,它通過API接口實(shí)現(xiàn)高效的分類創(chuàng)建、查詢、更新和刪除操作。本文將逐步介紹產(chǎn)品分類管理API的設(shè)計(jì)原理、關(guān)鍵功能和實(shí)現(xiàn)方法,
    的頭像 發(fā)表于 07-25 14:20 ?600次閱讀
    產(chǎn)品<b class='flag-5'>分類</b>管理API接口

    基于FPGA的SSD目標(biāo)檢測算法設(shè)計(jì)

    。有名的LeNet-5手寫數(shù)字識(shí)別網(wǎng)絡(luò),精度達(dá)到99%,AlexNet模型和VGG-16模型的提出突破了傳統(tǒng)圖像識(shí)別算法,GooLeNet和ResNet推動(dòng)了卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用。
    的頭像 發(fā)表于 07-10 11:12 ?2785次閱讀
    基于FPGA的SSD目標(biāo)檢測<b class='flag-5'>算法</b>設(shè)計(jì)
    新巴尔虎左旗| 兴城市| 乃东县| 西华县| 开远市| 北流市| 师宗县| 永定县| 安塞县| 平定县| 静安区| 曲水县| 炉霍县| 开阳县| 蓝山县| 萨迦县| 晋州市| 黄陵县| 凤凰县| 宁津县| 九江市| 洛川县| 永胜县| 武威市| 湟源县| 绥宁县| 九寨沟县| 宁强县| 邢台县| 阳春市| 斗六市| 抚远县| 霍林郭勒市| 岑溪市| 黎城县| 河西区| 新巴尔虎左旗| 和林格尔县| 万山特区| 陵川县| 宝鸡市|