日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于PYNQ的軟件框架實(shí)現(xiàn)SSD目標(biāo)檢測(cè)算法硬件加速方案

454398 ? 來(lái)源:PYNQ開(kāi)源社區(qū) ? 作者:PYNQ開(kāi)源社區(qū) ? 2020-09-26 11:33 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

設(shè)計(jì)目的與應(yīng)用

隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動(dòng)駕駛、醫(yī)療等各行各業(yè)。目標(biāo)識(shí)別作為人工智能的一項(xiàng)重要應(yīng)用也擁有著巨大的前景,隨著深度學(xué)習(xí)的普及和框架的成熟,卷積神經(jīng)網(wǎng)絡(luò)模型的識(shí)別精度越來(lái)越高。有名的LeNet-5手寫(xiě)數(shù)字識(shí)別網(wǎng)絡(luò),精度達(dá)到99%,AlexNet模型和VGG-16模型的提出突破了傳統(tǒng)圖像識(shí)別算法,GooLeNet和ResNet推動(dòng)了卷積神經(jīng)網(wǎng)絡(luò)的應(yīng)用。

但是神經(jīng)網(wǎng)絡(luò)的發(fā)展也給我們帶來(lái)了更多挑戰(zhàn),權(quán)重參數(shù)越來(lái)越多,計(jì)算量越來(lái)越大導(dǎo)致了復(fù)雜的模型很難移植到移動(dòng)端或嵌入式設(shè)備中,且嵌入式環(huán)境對(duì)功耗、實(shí)時(shí)性、存儲(chǔ)都有著嚴(yán)格的約束。因此如何將卷積神經(jīng)網(wǎng)絡(luò)部署到嵌入式設(shè)備中是一件非常有意義的事情。目前神經(jīng)網(wǎng)絡(luò)在傳統(tǒng)嵌入式設(shè)備上絕大部分是基于ARM平臺(tái),神經(jīng)網(wǎng)絡(luò)在ARM上部署時(shí)存在的巨大問(wèn)題是算力的不足。GPU主要應(yīng)用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練階段,對(duì)環(huán)境和庫(kù)的依賴(lài)性較大,國(guó)內(nèi)技術(shù)積累較弱,難以實(shí)現(xiàn)技術(shù)自主可控。ASIC 是為特定需求而專(zhuān)門(mén)定制優(yōu)化開(kāi)發(fā)的架構(gòu),靈活性較差,缺乏統(tǒng)一的軟硬件開(kāi)發(fā)環(huán)境,開(kāi)發(fā)周期長(zhǎng)且造價(jià)極高。所以,基于FPGA的硬件加速平臺(tái)是時(shí)候發(fā)揮它的優(yōu)勢(shì)了。FPGA由于獨(dú)特的架構(gòu),被廣泛的應(yīng)用與實(shí)時(shí)信號(hào)處理、圖像處理領(lǐng)域,其并行性也為卷積神經(jīng)網(wǎng)絡(luò)提供了巨大算力。

傳統(tǒng)的RTL開(kāi)發(fā)FPGA流程相比緩慢,不如軟件的開(kāi)發(fā)效率高,所以HLS運(yùn)營(yíng)而生,使用高層次語(yǔ)言來(lái)進(jìn)行轉(zhuǎn)換為底層的硬件代碼,極大的加快開(kāi)發(fā)進(jìn)程。因此項(xiàng)目選用HLS工具來(lái)實(shí)現(xiàn)算法中的加速I(mǎi)P核,將SSD目標(biāo)檢測(cè)網(wǎng)絡(luò)移植到FPGA硬件平臺(tái)上, 對(duì)于硬件加速過(guò)程中的算法并行性,在本設(shè)計(jì)中主要采用兩個(gè)方式:對(duì)層內(nèi)的運(yùn)算并行化,將多個(gè)通道的數(shù)據(jù)進(jìn)行分塊,每一塊內(nèi)的通道同時(shí)進(jìn)行運(yùn)算,最后將結(jié)果累加在一起。對(duì)于模塊的運(yùn)算采用HLS并行優(yōu)化,對(duì)數(shù)組核循環(huán)添加優(yōu)化指令進(jìn)行優(yōu)化。整個(gè)系統(tǒng)采用PYNQ的軟件框架來(lái)實(shí)現(xiàn),為SSD目標(biāo)檢測(cè)算法提供了硬件加速方案,充分發(fā)揮了FPGA的并行性。

SSD目標(biāo)檢測(cè)算法原理

SSD于2016年提出,是經(jīng)典的單階段目標(biāo)檢測(cè)模型之一。它的精度可以媲美FasterRcnn雙階段目標(biāo)檢測(cè)方法,速度卻達(dá)到了59FPS(512x512,TitanV),單階段目標(biāo)檢測(cè)方法的目標(biāo)檢測(cè)和分類(lèi)是同時(shí)完成的,其主要思路是利用CNN提取特征后,均勻地在圖片的不同位置進(jìn)行密集抽樣,抽樣時(shí)可以采用不同尺度和長(zhǎng)寬比,物體分類(lèi)與預(yù)測(cè)框的回歸同時(shí)進(jìn)行,整個(gè)過(guò)程只需要一步,所以其優(yōu)勢(shì)是速度快。

SSD采用的主干網(wǎng)絡(luò)是VGG網(wǎng)絡(luò),VGG是由Simonyan 和Zisserman在文獻(xiàn)《Very Deep Convolutional Networks for Large Scale Image Recognition》中提出卷積神經(jīng)網(wǎng)絡(luò)模型,其名稱(chēng)來(lái)源于作者所在的牛津大學(xué)視覺(jué)幾何組(Visual Geometry Group)的縮寫(xiě)。該模型參加2014年的 ImageNet圖像分類(lèi)與定位挑戰(zhàn)賽,取得了優(yōu)異成績(jī):在分類(lèi)任務(wù)上排名第二,在定位任務(wù)上排名第一。

基于PYNQ的軟件框架實(shí)現(xiàn)SSD目標(biāo)檢測(cè)算法硬件加速方案

圖1.VGG16網(wǎng)絡(luò)結(jié)構(gòu)

這里的VGG網(wǎng)絡(luò)相比普通的VGG網(wǎng)絡(luò)有一定的修改,主要修改的地方就是:

1、將VGG16的FC6和FC7層轉(zhuǎn)化為卷積層。

2、去掉所有的Dropout層和FC8層;

3、新增了Conv6、Conv7、Conv8、Conv9。

圖2.SSD主干網(wǎng)絡(luò)結(jié)構(gòu)

上圖展示了SSD的主干網(wǎng)絡(luò)結(jié)構(gòu),整個(gè)網(wǎng)絡(luò)為全卷積網(wǎng)絡(luò)結(jié)構(gòu),SSD將VGG16的兩個(gè)全連接層轉(zhuǎn)換成了普通的卷積層,池化層POOL5由原來(lái)的stride=2,kernel大小2x2變成stride=1,kernel大小3x3,為了不改變特征圖大小同時(shí)獲得更大的感受野,Conv6改為空洞卷積,diliation=6,輸入的圖片經(jīng)過(guò)了改進(jìn)的VGG網(wǎng)絡(luò)(Conv1->fc7)和幾個(gè)另加的卷積層(Conv6->Conv9)進(jìn)行特征提取。

從圖2我們可以看出,SSD將conv4_3、conv7、conv6_2、conv7_2、conv8_2、conv9_2都連接到了最后的檢測(cè)分類(lèi)層做回歸,6個(gè)特征圖分別預(yù)測(cè)不同大小和長(zhǎng)寬比的邊界框,具體細(xì)節(jié)如圖3。

圖3.SSD特征提取網(wǎng)絡(luò)

SSD為每個(gè)檢測(cè)層都預(yù)定義了不同大小的先驗(yàn)框(prior boxes),Conv4_3、Conv8_2和Conv9_2分別有4個(gè)先驗(yàn)框,而Conv7、conv7_2和Conv8_2分別有6種先驗(yàn)框,即對(duì)應(yīng)于特征圖上的每個(gè)像素,都會(huì)生成4或6個(gè)prior box.

在淺層的神經(jīng)網(wǎng)絡(luò)里,只能看到圖片的細(xì)節(jié)和紋理信息,就如管中窺豹。隨著網(wǎng)絡(luò)層數(shù)的加深,相當(dāng)于把圖片往后移動(dòng)一段距離。這樣才能夠感知到圖片的整體信息。低層卷積可以捕捉到更多的細(xì)節(jié)信息,高層卷積可以捕捉到更多的抽象信息。低層特性更關(guān)心“在哪里”,但分類(lèi)準(zhǔn)確度不高,而高層特性更關(guān)心“是什么”,但丟失了物體的位置信息。SSD正是利用不同尺度檢測(cè)圖片中不同大小和類(lèi)別的目標(biāo)物體,獲得了很好的效果。

作品展示





聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1664

    文章

    22516

    瀏覽量

    639694
  • SSD
    SSD
    +關(guān)注

    關(guān)注

    21

    文章

    3155

    瀏覽量

    122639
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50385

    瀏覽量

    267122
  • 卷積神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    4

    文章

    375

    瀏覽量

    12932
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    FPGA硬件加速卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 硬件加速卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    FPGA硬件加速, PCIe半高卡, XCKU115, 光纖采集卡, 信號(hào)計(jì)算板, 硬件加速
    的頭像 發(fā)表于 02-12 09:52 ?579次閱讀
    FPGA<b class='flag-5'>硬件加速</b>卡設(shè)計(jì)原理圖:1-基于Xilinx XCKU115的半高PCIe x8 <b class='flag-5'>硬件加速</b>卡 PCIe半高 XCKU115-3-FLVF1924-E芯片

    YOLO5目標(biāo)檢測(cè)方案-基于米爾RK3576開(kāi)發(fā)板

    據(jù)傳輸以及GPU直接顯示的協(xié)同優(yōu)化,能夠徹底釋放 RK3576平臺(tái)的異構(gòu)計(jì)算潛力,將端到端延遲控制在數(shù)十毫秒內(nèi),實(shí)現(xiàn)高清、實(shí)時(shí)的目標(biāo)檢測(cè)應(yīng)用。這一優(yōu)化思路同樣適用于其他具備類(lèi)似硬件加速
    發(fā)表于 01-22 19:21

    Melexis推出針對(duì)FIR陣列的免費(fèi)版人員檢測(cè)算法

    全球微電子工程公司Melexis宣布,重磅推出專(zhuān)為MLX90642(FIR) 32×24熱傳感器陣列設(shè)計(jì)的新型人員檢測(cè)算法,可實(shí)現(xiàn)人員檢測(cè)、精確計(jì)數(shù)以及位置定位。與傳統(tǒng)攝像頭相比,該解決方案
    的頭像 發(fā)表于 12-15 17:30 ?638次閱讀

    復(fù)雜的軟件算法硬件IP核的實(shí)現(xiàn)

    硬件加速 IP 核 HDL 文件的生成分為兩個(gè)步驟,首先根據(jù)將要接入的 SOPC 系統(tǒng)的總線(xiàn)的特性,將算法做適當(dāng)?shù)陌b、暴露相關(guān)的接口以及調(diào)用方法,即適配總線(xiàn)接口。不同的 SOPC 總線(xiàn)有不同的時(shí)序以及
    發(fā)表于 10-30 07:02

    常用硬件加速的方法

    之前總結(jié)了一些常用硬件加速方法 1)面積換速度:也就是串轉(zhuǎn)并運(yùn)算,可以多個(gè)模塊同時(shí)計(jì)算; 2)時(shí)間換空間:時(shí)序收斂下通過(guò)頻率提高性能,雖然面積可能稍微加大點(diǎn); 3)流水線(xiàn)操作:流水線(xiàn)以面積換性能,以
    發(fā)表于 10-29 06:20

    目標(biāo)追蹤的簡(jiǎn)易實(shí)現(xiàn):模板匹配

    在分析硬件加速之前,首先要弄明白這個(gè)算法軟件實(shí)現(xiàn)中有哪些冗余的操作:首先是遍歷次數(shù)多(前文算出來(lái)的就已經(jīng)達(dá)到了 82.6 萬(wàn)次),每次遍歷都需要對(duì) 50 * 50=2500 個(gè)像
    發(fā)表于 10-28 07:21

    硬件加速模塊的時(shí)鐘設(shè)計(jì)

    硬件加速模塊需要四個(gè)時(shí)鐘,分別為clk_l , clk_r , clk_c , clk_n 。 clk_l : 整個(gè)硬件加速模塊為了最大化的節(jié)約時(shí)間成本而采用了類(lèi)似處理器的流水線(xiàn)設(shè)計(jì),具體上將每一層
    發(fā)表于 10-23 07:28

    如何驗(yàn)證硬件加速是否真正提升了通信協(xié)議的安全性?

    是具體驗(yàn)證方法與框架,覆蓋從底層硬件到上層協(xié)議的全鏈路驗(yàn)證: 一、基礎(chǔ)驗(yàn)證:硬件加速模塊的安全功能正確性 硬件加速(如加密 / 解密、哈希計(jì)算、密鑰管理)是通信協(xié)議安全的 “底層支撐”
    的頭像 發(fā)表于 08-27 10:16 ?1372次閱讀
    如何驗(yàn)證<b class='flag-5'>硬件加速</b>是否真正提升了通信協(xié)議的安全性?

    有哪些方法可以確保硬件加速與通信協(xié)議的兼容性?

    安全風(fēng)險(xiǎn)。以下是具體可落地的方法,按實(shí)施階段和優(yōu)先級(jí)排序: 一、硬件選型階段:優(yōu)先選擇 “協(xié)議原生支持” 的硬件方案 硬件加速的兼容性根基在選型階段奠定,需明確
    的頭像 發(fā)表于 08-27 10:07 ?1385次閱讀

    如何利用硬件加速提升通信協(xié)議的安全性?

    產(chǎn)品實(shí)拍圖 利用硬件加速提升通信協(xié)議安全性,核心是通過(guò) 專(zhuān)用硬件模塊或可編程硬件 ,承接軟件層面難以高效處理的安全關(guān)鍵操作(如加密解密、認(rèn)證、密鑰管理等),在提升性能的同時(shí),通過(guò)
    的頭像 發(fā)表于 08-27 09:59 ?1212次閱讀
    如何利用<b class='flag-5'>硬件加速</b>提升通信協(xié)議的安全性?

    【機(jī)器視覺(jué)】睿擎平臺(tái)支持NCNN AI 推理框架,輕松實(shí)現(xiàn)實(shí)時(shí)目標(biāo)檢測(cè)( 睿擎線(xiàn)下 Workshop 報(bào)名已開(kāi)啟)|產(chǎn)品動(dòng)

    RT-Thread系統(tǒng)上深度集成NCNN推理框架,通過(guò)其輕量化架構(gòu)與硬件級(jí)優(yōu)化能力,結(jié)合YOLO系列算法的高效單階段檢測(cè)特性,實(shí)現(xiàn)了工業(yè)場(chǎng)景
    的頭像 發(fā)表于 08-20 17:40 ?5642次閱讀
    【機(jī)器視覺(jué)】睿擎平臺(tái)支持NCNN AI 推理<b class='flag-5'>框架</b>,輕松<b class='flag-5'>實(shí)現(xiàn)</b>實(shí)時(shí)<b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)</b>( 睿擎線(xiàn)下 Workshop 報(bào)名已開(kāi)啟)|產(chǎn)品動(dòng)

    【VisionFive 2單板計(jì)算機(jī)試用體驗(yàn)】在 VisionFive 2 上為目標(biāo)檢測(cè)準(zhǔn)備軟件環(huán)境并運(yùn)行 MobileNet-SSD 模型

    目標(biāo): 本教程將實(shí)現(xiàn)在 StarFive VisionFive 2 開(kāi)發(fā)板上為目標(biāo)檢測(cè)應(yīng)用準(zhǔn)備所需軟件環(huán)境,并最終運(yùn)行一個(gè)基于 Mobile
    發(fā)表于 07-10 19:51

    基于FPGA的SSD目標(biāo)檢測(cè)算法設(shè)計(jì)

    隨著人工智能的發(fā)展,神經(jīng)網(wǎng)絡(luò)正被逐步應(yīng)用于智能安防、自動(dòng)駕駛、醫(yī)療等各行各業(yè)。目標(biāo)識(shí)別作為人工智能的一項(xiàng)重要應(yīng)用也擁有著巨大的前景,隨著深度學(xué)習(xí)的普及和框架的成熟,卷積神經(jīng)網(wǎng)絡(luò)模型的識(shí)別精度越來(lái)越高
    的頭像 發(fā)表于 07-10 11:12 ?2789次閱讀
    基于FPGA的<b class='flag-5'>SSD</b><b class='flag-5'>目標(biāo)</b><b class='flag-5'>檢測(cè)算法</b>設(shè)計(jì)

    基于FPGA的壓縮算法加速實(shí)現(xiàn)

    本設(shè)計(jì)中,計(jì)劃實(shí)現(xiàn)對(duì)文件的壓縮及解壓,同時(shí)優(yōu)化壓縮中所涉及的信號(hào)處理和計(jì)算密集型功能,實(shí)現(xiàn)對(duì)其的加速處理。本設(shè)計(jì)的最終目標(biāo)是證明在充分并行化的硬件
    的頭像 發(fā)表于 07-10 11:09 ?2624次閱讀
    基于FPGA的壓縮<b class='flag-5'>算法</b><b class='flag-5'>加速</b><b class='flag-5'>實(shí)現(xiàn)</b>

    基于RK3576開(kāi)發(fā)板的安全帽檢測(cè)算法

    安全帽佩戴檢測(cè)是工地、生產(chǎn)安全、安防的重中之重,但人為主觀檢測(cè)的方式時(shí)效性差且不能全程監(jiān)控。AI技術(shù)的日漸成熟催生了安全帽佩戴檢測(cè)方案,成為了監(jiān)督佩戴安全帽的利器。本安全帽
    的頭像 發(fā)表于 05-08 16:59 ?2169次閱讀
    基于RK3576開(kāi)發(fā)板的安全帽<b class='flag-5'>檢測(cè)算法</b>
    临海市| 拉萨市| 石柱| 新竹县| 七台河市| 瑞金市| 富宁县| 广南县| 施甸县| 福贡县| 吉林省| 晋宁县| 桑植县| 南靖县| 太保市| 五指山市| 桐城市| 仪征市| 三原县| 灵宝市| 红桥区| 临海市| 日喀则市| 崇义县| 苍溪县| 昌宁县| 奉节县| 甘肃省| 六盘水市| 乃东县| 华池县| 临汾市| 花莲县| 高台县| 旬阳县| 长岛县| 泾川县| 乌审旗| 资源县| 玛纳斯县| 化州市|