10月16日,XDF(賽靈思開發(fā)者大會(huì))在北京國(guó)際飯店舉行。作為業(yè)界最權(quán)威、最具深度的FPGA交流大會(huì)之一,Xilinx把行業(yè)最頂尖的FPGA專家和企業(yè)匯聚一堂,集思廣益,分享和交流FPGA產(chǎn)品開發(fā)經(jīng)驗(yàn)與應(yīng)用方案。
Xilinx CEOVictor Peng 、華為IT智能計(jì)算業(yè)務(wù)副總裁張小華、阿里云FPGA異構(gòu)計(jì)算研發(fā)總監(jiān)張振祥等業(yè)內(nèi)領(lǐng)袖出席。同時(shí),在會(huì)上,賽靈思推出了業(yè)界首款自適應(yīng)計(jì)算加速平臺(tái)Versal和加速器Alveo。
作為Xilinx在中國(guó)智能汽車電子領(lǐng)域唯一的Certified member,深圳市自行科技有限公司(簡(jiǎn)稱:自行科技)受邀參加,公司聯(lián)合創(chuàng)始人兼CTO諶璟博士在現(xiàn)場(chǎng)分享了“基于FPGA的計(jì)算機(jī)視覺系統(tǒng)設(shè)計(jì)與開發(fā)”的主題演講。諶璟博士結(jié)合其多年的深度學(xué)習(xí)與FPGA開發(fā)經(jīng)驗(yàn),從性能、成本、開發(fā)難度等多個(gè)維度出發(fā),提出一套系統(tǒng)化的FPGA深度神經(jīng)網(wǎng)絡(luò)優(yōu)化流程。
圖:自行科技聯(lián)合創(chuàng)始人兼CTO諶璟博士做主題演講
諶博認(rèn)為,CNN與FPGA的結(jié)合可以組合利用多種算法模塊,充分發(fā)揮FPGA在計(jì)算速度、功耗、成本等方面的優(yōu)勢(shì),降低開發(fā)難度與周期,減少開發(fā)成本。但是CNN中存在大量冗余計(jì)算,因此如何在FPGA中實(shí)現(xiàn)CNN加速設(shè)計(jì)就尤為重要。
圖:諶璟博士演講獲得現(xiàn)場(chǎng)嘉賓觀眾好評(píng)
自行科技通過多年CNN與FPGA自主研發(fā)經(jīng)驗(yàn),開發(fā)出業(yè)內(nèi)領(lǐng)先性價(jià)比的FPGA加速設(shè)計(jì)方案。會(huì)中,她表示,F(xiàn)PGA加速設(shè)計(jì)需要算法工程師和FPGA工程師共同參與。
一方面,通過剪枝壓縮、權(quán)值壓縮等方法對(duì)網(wǎng)絡(luò)壓縮算法進(jìn)行優(yōu)化,以減少網(wǎng)絡(luò)冗余計(jì)算,釋放可用資源。例如,我們可以僅僅將少數(shù)“重要”的卷積核量化為8bit權(quán)值,其余卷積核用1bit權(quán)值表示,構(gòu)造混合精度網(wǎng)絡(luò),在確保網(wǎng)絡(luò)檢測(cè)性能的基礎(chǔ)上大幅度提高計(jì)算效率。
另一方面,不同的FPGA架構(gòu)需要適配對(duì)應(yīng)的CNN網(wǎng)絡(luò)結(jié)構(gòu),因此需要有針對(duì)性地進(jìn)行并行化和結(jié)構(gòu)化設(shè)計(jì),讓計(jì)算模塊得到充分利用,避免大量計(jì)算資源閑置。同時(shí),在進(jìn)行網(wǎng)絡(luò)設(shè)計(jì)時(shí)還要充分利用FPGA片內(nèi)資源,避免DSP計(jì)算資源與邏輯資源的浪費(fèi)。
以SSD網(wǎng)絡(luò)為例,在不考慮其他操作帶來的時(shí)延(DDR時(shí)延、FSM狀態(tài)轉(zhuǎn)移時(shí)延~等)的情況下,Xilinx zynq7020在CNN計(jì)算幀率最高可達(dá)5.7fps;但是,自行科技通過權(quán)值壓縮、并行化設(shè)計(jì)等CNN網(wǎng)絡(luò)加速設(shè)計(jì)和算法優(yōu)化后,計(jì)算幀率提升了4-5倍,大大提高了芯片的運(yùn)行效率。
最后,諶博總結(jié)到:“FPGA與CNN的結(jié)合具備廣泛的應(yīng)用前景,但是在開發(fā)的過程中也需要我們不斷克服困難和挑戰(zhàn)。當(dāng)前FPGA平臺(tái)技術(shù)與工具不斷迭代更新,這就需要我們時(shí)刻關(guān)注世界最前沿的技術(shù)。今天我非常高興在現(xiàn)場(chǎng)見證了業(yè)界首款自適應(yīng)計(jì)算加速平臺(tái)Versal ACAP以及新一代FPGA加速器卡Alveo。這不僅可以加快公司軟硬件迭代創(chuàng)新進(jìn)程,還為我們探索更優(yōu)秀的FPGA加速方案提供了思路。未來,隨著CNN的計(jì)算量不斷上升,數(shù)據(jù)吞吐量也會(huì)顯著增大,這就需要不斷提高FPGA片內(nèi)BRAM資源利用效率,深入研究CNN模型壓縮算法,優(yōu)化基于FPGA的CNN框架,這也需要行業(yè)共同的努力!”
目前,該方案已經(jīng)成功應(yīng)用于公司的三大產(chǎn)品:前向ADAS系統(tǒng)、駕駛員監(jiān)控(DMS)系統(tǒng)和智能環(huán)視影像系統(tǒng),產(chǎn)品都已順利實(shí)現(xiàn)量產(chǎn)?;贔PGA平臺(tái)與CNN算法的深度結(jié)合,自行科技率先開發(fā)出國(guó)內(nèi)首款基于深度學(xué)習(xí)技術(shù)的駕駛員監(jiān)控(DMS)系統(tǒng),打造出業(yè)內(nèi)功能最全面、性價(jià)比最高的駕駛員監(jiān)控(DMS)系統(tǒng),成為國(guó)內(nèi)駕駛員監(jiān)控系統(tǒng)標(biāo)桿企業(yè)。
除此之外,自行科技前向ADAS系統(tǒng)與智能環(huán)視影像系統(tǒng)以其可靠的目標(biāo)檢測(cè)準(zhǔn)確性和語(yǔ)義分割精度獲得國(guó)內(nèi)眾多傳統(tǒng)車廠(乘用車與商用車)、新能源和互聯(lián)網(wǎng)造車公司和Tier1汽車零部件供應(yīng)商的高度認(rèn)可。相信隨著FPGA開發(fā)技術(shù)的不斷成熟,CNN加速設(shè)計(jì)將獲得更廣泛的應(yīng)用。
更多自行科技的 ADAS解決方案信息:www.autocruis.com
附:賽靈思發(fā)布7nm 自適應(yīng)計(jì)算加速平臺(tái)Versal及新一代FPGA加速器Alveo
2018年10月16日,F(xiàn)PGA大廠賽靈思(Xilinx)在北京召開了一年一度的“Xilinx開發(fā)者大會(huì) ”(XDF) 。在本次會(huì)議上,賽靈思發(fā)布了全球首款自適應(yīng)計(jì)算加速平臺(tái) (Adaptive Compute Acceleration Platform ,ACAP)芯片系列Versal。與此同時(shí),賽靈思還針對(duì)云端和本地?cái)?shù)據(jù)中心市場(chǎng)還發(fā)布了一款功能強(qiáng)大的加速器卡——Alveo。

-
加速器
+關(guān)注
關(guān)注
2文章
841瀏覽量
40269 -
賽靈思
+關(guān)注
關(guān)注
33文章
1798瀏覽量
133684 -
深度學(xué)習(xí)
+關(guān)注
關(guān)注
73文章
5610瀏覽量
124656
原文標(biāo)題:自行科技CTO諶璟博士出席賽靈思開發(fā)者大會(huì),推出FPGA CNN加速設(shè)計(jì)方案
文章出處:【微信號(hào):zuosiqiche,微信公眾號(hào):佐思汽車研究】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
AMD Versal Gen 2開發(fā)實(shí)戰(zhàn)進(jìn)階工坊系列活動(dòng)即將舉辦
選擇AMD Alveo V80加速卡的五大理由
如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實(shí)現(xiàn)中的一些功能?
第二代AMD VERSAL AI EDGE系列全面賦能汽車ADAS系統(tǒng)
AMD Versal自適應(yīng)SoC中eMMC燒錄/啟動(dòng)調(diào)試檢查表(上)
AMD Alveo MA35D加速器:開啟大規(guī)模交互式流媒體新時(shí)代
工業(yè)級(jí)-專業(yè)液晶圖形顯示加速器RA8889ML3N簡(jiǎn)介+顯示方案選型參考表
邊緣計(jì)算中的AI加速器類型與應(yīng)用
AMD Versal自適應(yīng)SoC內(nèi)置自校準(zhǔn)的工作原理
高壓放大器驅(qū)動(dòng):基于FPGA的SPGD自適應(yīng)光學(xué)控制平臺(tái)的探索
創(chuàng)客總部加入MathWorks加速器計(jì)劃
Arm神經(jīng)技術(shù)是業(yè)界首創(chuàng)在 Arm GPU 上增添專用神經(jīng)加速器的技術(shù),移動(dòng)設(shè)備上實(shí)現(xiàn)PC級(jí)別的AI圖形性能
Microchip推出Adaptec? SmartRAID 4300 系列加速器 提供安全的可擴(kuò)展 NVMe? RAID 存儲(chǔ)解決方案
粒子加速器?——?科技前沿的核心裝置
Versal 600G DCMAC Subsystem LogiCORE IP產(chǎn)品指南
賽靈思推出了業(yè)界首款自適應(yīng)計(jì)算加速平臺(tái)Versal和加速器Alveo
評(píng)論