日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復(fù)

查看更多

查看更多

查看更多

VIP于到期續(xù)費(fèi)

登錄后你可以

下載海量資料
學(xué)習(xí)在線課程
觀看技術(shù)視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認(rèn)識你，還能領(lǐng)取20積分哦，立即完善>

3天內(nèi)不再提示

Yolo系列模型的部署、精度對齊與int8量化加速

Yolo系列模型的部署、精度對齊與int8量化加速

大家好，我是海濱。寫這篇文章的目的是為宣傳我在23年初到現(xiàn)在完成的一項(xiàng)工作---Yolo系列模型在TensorRT上的部署與量化加速，目前以通過視頻的形式在B站發(fā)布（不收費(fèi)，只圖一個一劍三連）。

麻雀雖小但五臟俱全，本項(xiàng)目系統(tǒng)介紹了YOLO系列模型在TensorRT上的量化方案，工程型較強(qiáng)，我們給出的工具可以實(shí)現(xiàn)不同量化方案在Yolo系列模型的量化部署，無論是工程實(shí)踐還是學(xué)術(shù)實(shí)驗(yàn)，相信都會對你帶來一定的幫助。

B站地址（求關(guān)注和三連）：https://www.bilibili.com/video/BV1Ds4y1k7yr/

Github開源地址（求star）：https://github.com/thb1314/mmyolo_tensorrt/

當(dāng)時(shí)想做這個的目的是是為了總結(jié)一下目標(biāo)檢測模型的量化加速到底會遇到什么坑，只是沒想到不量化坑都會很多。

比如即使是以FP32形式推理，由于TensorRT算子參數(shù)的一些限制和TRT和torch內(nèi)部實(shí)現(xiàn)的不同，導(dǎo)致torch推理結(jié)果會和TensorRT推理結(jié)果天然的不統(tǒng)一，至于為什么不統(tǒng)一這里賣個關(guān)子大家感興趣可以看下視頻。

下面說一下我們這個項(xiàng)目做了哪些事情

YOLO系列模型在tensorrt上的部署與精度對齊

該項(xiàng)目詳細(xì)介紹了Yolo系列模型在TensorRT上的FP32的精度部署，基于mmyolo框架導(dǎo)出各種yolo模型的onnx，在coco val數(shù)據(jù)集上對齊torch版本與TensorRT版本的精度。

在此過程中我們發(fā)現(xiàn)，由于TopK算子限制和NMS算子實(shí)現(xiàn)上的不同，我們無法完全對齊torch和yolo模型的精度，不過這種風(fēng)險(xiǎn)是可解釋且可控的。

詳解TensorRT量化的三種實(shí)現(xiàn)方式

TensorRT量化的三種實(shí)現(xiàn)方式包括trt7自帶量化、dynamic range api，trt8引入的QDQ算子。

Dynamic range api會在采用基于MQbench框架做PTQ時(shí)講解。

TensorRT引入的QDQ算子方式在針對Yolo模型的PTQ和QAT方式時(shí)都有詳細(xì)的闡述，當(dāng)然這個過程也沒有那么順利。

在基于PytorchQuantization導(dǎo)出的含有QDQ節(jié)點(diǎn)的onnx時(shí)，我們發(fā)現(xiàn)盡管量化版本的torch模型精度很高，但是在TensorRT部署時(shí)精度卻很低，TRT部署收精度損失很嚴(yán)重，通過可視化其他量化形式的engine和問題engine進(jìn)行對比，我們發(fā)現(xiàn)是一些層的int8量化會出問題，由此找出問題量化節(jié)點(diǎn)解決。

詳解MQbench量化工具包在TensorRT上的應(yīng)用

我們研究了基于MQbench框架的普通PTQ算法和包括Adaround高階PTQ算法，且啟發(fā)于Adaround高階PTQ算法。

我們將torch版本中的HistogramObserver引入到MQBench中，activation采用HistogramObserverweight采用MinMaxObserver，在PTQ過程中，weight的校準(zhǔn)前向傳播一次，activation的校準(zhǔn)需要多次因此我們將weight的PTQ過程和activation的PTQ過程分開進(jìn)行，加速PTQ量化。實(shí)踐證明，我們采用上述配置的分離PTQ量化在yolov8上可以取得基本不掉點(diǎn)的int8量化精度。

針對YoloV6這種難量化模型，分別采用部分量化和QAT來彌補(bǔ)量化精度損失

在部分量化階段，我們采用量化敏感層分析技術(shù)來判斷哪些層最需要恢復(fù)原始精度，給出各種metric的量化敏感層實(shí)現(xiàn)。

在QAT階段，不同于原始Yolov6論文中蒸餾+RepOPT的方式，我們直接采用上述部分量化后的模型做出初始模型進(jìn)行finetune，結(jié)果發(fā)現(xiàn)finetune后的模型依然取得不錯效果。

針對旋轉(zhuǎn)目標(biāo)檢測，我們同樣給出一種端到端方案，最后的輸出就是NMS后的結(jié)果。通過將TensorRT中的EfficientNMS Plugin和mmcv中旋轉(zhuǎn)框iou計(jì)算的cuda實(shí)現(xiàn)相結(jié)合，給出EfficientNMS for rotated box版本，經(jīng)過簡單驗(yàn)證我們的TRT版本與Torch版本模型輸出基本對齊。

以上就是我們這個項(xiàng)目做的事情，歡迎各位看官關(guān)注b站和一劍三連。同時(shí)，如果各位有更好的想法也歡迎給我們的git倉庫提PR。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

算法

算法

+關(guān)注

關(guān)注
23

文章
4810

瀏覽量
98603
模型

模型

+關(guān)注

關(guān)注
1

文章
3831

瀏覽量
52285
精度

精度

+關(guān)注

關(guān)注
0

文章
274

瀏覽量
20835

原文標(biāo)題：Yolo系列模型的部署、精度對齊與int8量化加速

文章出處：【微信號：GiantPandaCV，微信公眾號：GiantPandaCV】歡迎添加關(guān)注！文章轉(zhuǎn)載請注明出處。

評論

精選推薦
更多

文章

資料

帖子

「智匯邊緣·雙核競放」AIoT大賽報(bào)名開啟，獎金+算力卡等你拿

RT-Thread官方賬號
3天前

6390 閱讀

瑞薩RA系列FSP庫開發(fā)實(shí)戰(zhàn)指南之AGT低功耗定時(shí)器簡介和結(jié)構(gòu)框圖

瑞薩嵌入式小百科
3天前

3249 閱讀

押注機(jī)器人賽道！IQ10算力狂飆，高通攜手阿加犀加速機(jī)器人大小腦方案落地

章鷹觀察
3天前

1w 閱讀

霸州x華為：立一個存力支點(diǎn)，撬動華北平原的數(shù)據(jù)富礦

腦極體
3天前

7118 閱讀

實(shí)戰(zhàn) | 睿擎平臺SQLite：嵌入式設(shè)備上的數(shù)據(jù)持久化方案，從移植到應(yīng)用一文打通

RT-Thread官方賬號
4天前

4080 閱讀

bk-sops藍(lán)鯨智云標(biāo)準(zhǔn)運(yùn)維

golabs
10.37 MB

免費(fèi)

0下載

Visual-Studio-Addin Visual Studio擴(kuò)展插件

laisvl
1.65 MB

2積分

2下載

Antox Android即時(shí)聊天工具

蒲泛粟
1.96 MB

免費(fèi)

0下載

局域網(wǎng)發(fā)布共享文件xml-rpc實(shí)現(xiàn)的文件共享

樂僑珂
0.01 MB

2積分

3下載

ReShade游戲/視頻后期渲染工具

時(shí)見棲鴉
1.63 MB

2積分

1下載

【RA-Eco-RA4M2開發(fā)板評測】在觸摸按鍵例程上添加0.96寸OLED驅(qū)動并顯示漢字

吉吉祥
5天前

1415 閱讀

【RA-Eco-RA4M2開發(fā)板評測】+ 光照強(qiáng)度檢測

jinglixixi
12天前

3424 閱讀

【RA-Eco-RA4M2開發(fā)板評測】+ 導(dǎo)航鍵模塊及其性能測試

jinglixixi
14天前

3627 閱讀

《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 26年第7期：2026.3.30--2025.4.15

電子人steve
17天前

4425 閱讀

從零開始學(xué)硬件 <3>demo源碼1.OceanOS-CM0-B1解讀

jf_28912132
19天前

5430 閱讀

推薦專欄
更多

企業(yè)產(chǎn)品

資料

方案
更多

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設(shè)計(jì)技術(shù)

可編程邏輯

電源/新能源

MEMS/傳感技術(shù)

測量儀表

嵌入式技術(shù)

制造/封裝

模擬技術(shù)

RF/無線

接口/總線/驅(qū)動

處理器/DSP

EDA/IC設(shè)計(jì)

存儲技術(shù)

光電顯示

EMC/EMI設(shè)計(jì)

連接器

行業(yè)應(yīng)用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡(luò)

醫(yī)療電子

人工智能

虛擬現(xiàn)實(shí)

可穿戴設(shè)備

機(jī)器人

安全設(shè)備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設(shè)備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學(xué)院

設(shè)計(jì)資源

設(shè)計(jì)技術(shù)

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術(shù)文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務(wù)

產(chǎn)品

資料

文章

方案

企業(yè)

供應(yīng)鏈服務(wù)

硬件開發(fā)

媒體服務(wù)

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗(yàn)

設(shè)計(jì)大賽

電子發(fā)燒友

關(guān)于我們

聯(lián)系我們

舉報(bào)投訴

社交網(wǎng)絡(luò)

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關(guān)注我們的微信

下載發(fā)燒友APP

機(jī)器人發(fā)燒友

版權(quán)所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 電信與信息服務(wù)業(yè)務(wù)經(jīng)營許可證：湘B2-20260003 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
日B视频亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

景洪市| 镇宁| 蓝田县| 绍兴市| 柳河县| 中西区| 通州市| 龙胜| 中卫市| 合川市| 泗阳县| 白银市| 黑河市| 营口市| 廊坊市| 区。| 大丰市| 峡江县| 海盐县| 龙陵县| 佳木斯市| 黄石市| 渭南市| 环江| 长乐市| 阿鲁科尔沁旗| 林州市| 老河口市| 留坝县| 大理市| 富平县| 当阳市| 涪陵区| 原阳县| 中方县| 天长市| 凤翔县| 商河县| 合水县| 宁强县| 句容市|