日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

英特爾AI實(shí)驗(yàn)室推出了高性能的神經(jīng)網(wǎng)絡(luò)壓縮工具Distiller

nlfO_thejiangme ? 來(lái)源:未知 ? 作者:李倩 ? 2018-11-06 10:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,英特爾AI 實(shí)驗(yàn)室推出了高性能的神經(jīng)網(wǎng)絡(luò)壓縮工具Distiller,便捷地實(shí)現(xiàn)了更小更快更高效的神經(jīng)網(wǎng)絡(luò)計(jì)算。Distiller目前在PyTorch中實(shí)現(xiàn)了一系列壓縮分析算法,包括稀疏引導(dǎo)算法和低精度近似算法。工具包主要由以下三個(gè)部分組成:

一套集成了剪枝、正則化與量化的算法;

一系列分析和評(píng)價(jià)壓縮表現(xiàn)的工具;

以及一系列前沿壓縮算法的實(shí)現(xiàn)樣例。

更小更快更節(jié)能

目前的絕大多數(shù)神經(jīng)網(wǎng)絡(luò)都越來(lái)越深,其參數(shù)達(dá)到了百萬(wàn)量級(jí)。如此龐大的模型即使在硬件加速的條件下也是十分消耗資源的計(jì)算密集型算法,即使只考慮推理階段也需要花費(fèi)較多的時(shí)間。在某些低延時(shí)的場(chǎng)合,比如說(shuō)自動(dòng)駕駛和控制領(lǐng)域這樣的處理時(shí)間就會(huì)造成很多問(wèn)題。同時(shí)在消費(fèi)電子上較長(zhǎng)的延時(shí)也會(huì)造成用戶(hù)體驗(yàn)的下降。

大型模型同時(shí)也會(huì)消耗大量的內(nèi)存,以及隨之而來(lái)的算力與能耗,這對(duì)于移動(dòng)設(shè)備來(lái)說(shuō)是十分重要的問(wèn)題。同樣對(duì)于大型數(shù)據(jù)中心來(lái)說(shuō)模型的能耗也是不同忽視的問(wèn)題。同時(shí)考慮到存儲(chǔ)和傳輸?shù)南拗?,神?jīng)網(wǎng)絡(luò)的壓縮具有十分重要的現(xiàn)實(shí)需求。在精度可以接受的條件下,壓縮的越小神經(jīng)網(wǎng)絡(luò)需要的計(jì)算資源和帶寬就越少。由于深度神經(jīng)網(wǎng)絡(luò)的權(quán)重矩陣具有稀疏性,通過(guò)正則化和剪枝以及量化過(guò)程可以很好的壓縮模型的體量。

稀疏的神經(jīng)網(wǎng)絡(luò)模型表示可以被大幅度壓縮。目前很多神經(jīng)網(wǎng)絡(luò)性能都受制于帶寬,這意味著它們的計(jì)算性能主要取決于可用的帶寬,帶寬不足的情況下硬件需要用更多的時(shí)間將數(shù)據(jù)輸入到計(jì)算單元中。全連接層、RNN和LSTM等典型的結(jié)構(gòu)就受制于帶寬。如果能夠減小這些層所需要的帶寬就能大幅提高它們的速度。

通過(guò)修剪模型中的某些權(quán)重、核甚至是整個(gè)層實(shí)現(xiàn)減小帶寬提高速度的功能,但同時(shí)卻不影響算法最終精度的表現(xiàn),也減小了功耗和延時(shí)。最后考慮到讀寫(xiě)非片上存儲(chǔ)的能耗是片上存儲(chǔ)的兩個(gè)量級(jí)以上,如果較小的模型可以保存在片上存儲(chǔ)中,可以使性能得到質(zhì)的飛躍,讓延時(shí)和能耗也隨之降低。所以同時(shí)稀疏或者壓縮表示時(shí),可以有效提升算法的表現(xiàn)。

工具框架

Distiller目前的設(shè)計(jì)與PyTorch進(jìn)行集成,其設(shè)計(jì)理念如下圖所示,PyTorch的訓(xùn)練與Distiller進(jìn)行交互。在distiller中包含了調(diào)度、算法和應(yīng)用等主要模塊以及匯總、日志的輔助功能,在很多常見(jiàn)的科學(xué)計(jì)算包的基礎(chǔ)上利用jupyter實(shí)現(xiàn)交互功能,基于tensorboard實(shí)現(xiàn)模型和日志信息的展示。

算法

Distiller中集成了先進(jìn)的剪枝和量化算法,幫助用戶(hù)有效的壓縮模型的體量。

剪枝算法主要分為了權(quán)重正則化、權(quán)重修剪、低精度等三種實(shí)現(xiàn)方式,7種具體的方法。

幅度剪枝利用閾值來(lái)將每一個(gè)權(quán)重進(jìn)行二值化,小于閾值的權(quán)重將被設(shè)為0,不同的層可以設(shè)置不同的權(quán)值;

敏感度剪枝與閾值的方法類(lèi)似,但使用了敏感因子s與這一層的權(quán)重分布標(biāo)準(zhǔn)差σ的乘積來(lái)作為閾值。越敏感的層(靠近輸入的)設(shè)置的s就越??;

level剪枝通過(guò)設(shè)置稀疏度來(lái)實(shí)現(xiàn)剪枝,這種方法相較于前面方法穩(wěn)定,因?yàn)槟繕?biāo)的稀疏程度與元素的賦值不相關(guān)。

自動(dòng)梯度剪枝(AGP)

這種方法的稀疏度將會(huì)隨著初始稀疏和最終稀疏自適應(yīng)的變化;

RNN剪枝

結(jié)構(gòu)剪枝(通過(guò)移除整個(gè)核、濾波器甚至是整個(gè)特征圖來(lái)實(shí)現(xiàn)):包含了結(jié)構(gòu)排序剪枝和對(duì)于較少激活特征圖的激活相關(guān)剪枝。

量化也是一類(lèi)重要的壓縮算法,Distall中同時(shí)也集成了四種量化算法:

DoReFa-Net: Training Low Bitwidth Convolutional Neural Networks with Low Bitwidth Gradients

PACT: Parameterized Clipping Activation for Quantized Neural Networks

WRPN: Wide Reduced-Precision Networks

對(duì)稱(chēng)線(xiàn)性量化

安 裝

如果想要使用這個(gè)工具的小伙伴,可以到git上下載

$ git clone https://github.com/NervanaSystems/distiller.git

$ cd distiller

然后利用你喜歡的工具創(chuàng)建一個(gè)python虛擬環(huán)境

$ python3 -m virtualenv env

激活環(huán)境并安裝對(duì)應(yīng)的依賴(lài)包:

$ source env/bin/activate

$ pip3 install -r requirements.txt

注:這一版本依賴(lài)于CUDA8.0,會(huì)自動(dòng)安裝PyTorch3.1

然后就可以愉快的使用了,可以通過(guò)運(yùn)行下面的文件來(lái)熟悉工具的使用:

distiller/examples/classifier_compression/compress_classifier.py

#example

$ python3 compress_classifier.py --arch simplenet_cifar ../../../data.cifar10 -p 30 -j=1 --lr=0.01

#對(duì)于cifar10壓縮

$ time python3 compress_classifier.py -a alexnet --lr 0.005 -p 50 ../../../data.imagenet -j 44 --epochs 90 --pretrained --compress=../sensitivity-pruning/alexnet.schedule_sensitivity.yaml

#利用yaml配置文件來(lái)運(yùn)行

另外example下還有多個(gè)例子可以嘗試。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 英特爾
    +關(guān)注

    關(guān)注

    61

    文章

    10334

    瀏覽量

    181262
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4845

    瀏覽量

    108298

原文標(biāo)題:英特爾推出全新可便捷實(shí)現(xiàn)「更小更快更高效的神經(jīng)網(wǎng)絡(luò)計(jì)算」的壓縮工具Distiller

文章出處:【微信號(hào):thejiangmen,微信公眾號(hào):將門(mén)創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI工作站本地養(yǎng)龍蝦!英特爾雙芯混合算力,告別云端Token焦慮

    4月23日,英特爾公司在北京舉辦新一代AI工作站平臺(tái)發(fā)布會(huì),英特爾中國(guó)區(qū)技術(shù)部總經(jīng)理高宇宣布,面向AI工作站,英特爾
    的頭像 發(fā)表于 04-26 16:27 ?1.1w次閱讀
    <b class='flag-5'>AI</b>工作站本地養(yǎng)龍蝦!<b class='flag-5'>英特爾</b>雙芯混合算力,告別云端Token焦慮

    燧弘華創(chuàng)攜手英特爾共建聯(lián)合實(shí)驗(yàn)室

    ,由燧弘華創(chuàng)與英特爾聯(lián)合主辦的“智聚芯能 共繪新篇”2026技術(shù)研討會(huì)在福州召開(kāi)。會(huì)上,燧弘華創(chuàng)-英特爾聯(lián)合實(shí)驗(yàn)室正式揭牌并全面啟動(dòng)建設(shè),旨在通過(guò)多元算力解決方案的聯(lián)合創(chuàng)新,為下一代人工智能數(shù)據(jù)中心(AIDC)筑牢
    的頭像 發(fā)表于 04-07 13:53 ?319次閱讀

    英特爾Arria 10器件:高性能與低功耗的完美結(jié)合

    英特爾Arria 10器件:高性能與低功耗的完美結(jié)合 在當(dāng)今電子技術(shù)飛速發(fā)展的時(shí)代,現(xiàn)場(chǎng)可編程門(mén)陣列(FPGA)和片上系統(tǒng)(SoC)在眾多領(lǐng)域發(fā)揮著至關(guān)重要的作用。英特爾的Arria 10器件家族
    的頭像 發(fā)表于 03-29 13:05 ?353次閱讀

    性能再越級(jí)!英特爾推出全新酷睿Ultra 200HX Plus系列移動(dòng)處理器

    Plus系列專(zhuān)為高性能游戲、流媒體、內(nèi)容創(chuàng)作和工作站應(yīng)用而優(yōu)化。新推出的兩款新處理器——英特爾酷睿 Ultra 9 290HX Plus和酷睿 Ultra 7 270HX Plus,不僅
    的頭像 發(fā)表于 03-19 16:43 ?428次閱讀

    英特爾與華陽(yáng)通用聯(lián)手推出全新AI Box解決方案

    英特爾宣布推出基于最新英特爾 酷睿 Ultra 架構(gòu)的AI Box解決方案,將PC級(jí)旗艦算力引入汽車(chē)、工業(yè)自動(dòng)化、軌道交通、機(jī)器人等多種工業(yè)環(huán)境,為各行各業(yè)接入
    的頭像 發(fā)表于 03-02 14:15 ?852次閱讀

    香港科技大學(xué)與英特爾共建聯(lián)合實(shí)驗(yàn)室,聚焦高能效智能計(jì)算

    香港科技大學(xué)與英特爾宣布成立“香港科技大學(xué)-英特爾聯(lián)合實(shí)驗(yàn)室”(以下簡(jiǎn)稱(chēng)“聯(lián)合實(shí)驗(yàn)室”)。該實(shí)驗(yàn)室將開(kāi)展為期三年的研究計(jì)劃,重點(diǎn)探索高能效近
    的頭像 發(fā)表于 02-05 16:30 ?845次閱讀
    香港科技大學(xué)與<b class='flag-5'>英特爾</b>共建聯(lián)合<b class='flag-5'>實(shí)驗(yàn)室</b>,聚焦高能效智能計(jì)算

    英特爾與憶聯(lián)重磅推出企業(yè)級(jí)網(wǎng)絡(luò)存儲(chǔ)解決方案

    為應(yīng)對(duì)AI大模型時(shí)代多元化的存儲(chǔ)挑戰(zhàn)與存算分離部署需求,英特爾與憶聯(lián)基于既有合作成果,再度深化協(xié)同創(chuàng)新。依托RDMA與NVMe硬件技術(shù),結(jié)合SPDK高性能存儲(chǔ)服務(wù),重磅推出企業(yè)級(jí)
    的頭像 發(fā)表于 02-02 09:14 ?1335次閱讀
    <b class='flag-5'>英特爾</b>與憶聯(lián)重磅<b class='flag-5'>推出</b>企業(yè)級(jí)<b class='flag-5'>網(wǎng)絡(luò)</b>存儲(chǔ)解決方案

    神經(jīng)網(wǎng)絡(luò)的初步認(rèn)識(shí)

    日常生活中的智能應(yīng)用都離不開(kāi)深度學(xué)習(xí),而深度學(xué)習(xí)則依賴(lài)于神經(jīng)網(wǎng)絡(luò)的實(shí)現(xiàn)。什么是神經(jīng)網(wǎng)絡(luò)?神經(jīng)網(wǎng)絡(luò)的核心思想是模仿生物神經(jīng)系統(tǒng)的結(jié)構(gòu),特別是大腦中神經(jīng)
    的頭像 發(fā)表于 12-17 15:05 ?513次閱讀
    <b class='flag-5'>神經(jīng)網(wǎng)絡(luò)</b>的初步認(rèn)識(shí)

    NMSIS神經(jīng)網(wǎng)絡(luò)庫(kù)使用介紹

    NMSIS NN 軟件庫(kù)是一組高效的神經(jīng)網(wǎng)絡(luò)內(nèi)核,旨在最大限度地提高 Nuclei N 處理器內(nèi)核上的神經(jīng)網(wǎng)絡(luò)性能并最??大限度地減少其內(nèi)存占用。 該庫(kù)分為多個(gè)功能,每個(gè)功能涵蓋特定類(lèi)別
    發(fā)表于 10-29 06:08

    Solidigm 成立AI中央實(shí)驗(yàn)室,配備高性能、大密度存儲(chǔ)測(cè)試集群

    實(shí)驗(yàn)室。該實(shí)驗(yàn)室配備了專(zhuān)為多種AI工作負(fù)載量身打造的高性能、高密度的存儲(chǔ)測(cè)試集群。 這座先進(jìn)的 AI 中央
    的頭像 發(fā)表于 10-10 17:03 ?1026次閱讀

    無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究

    MATLAB/SIMULINK工具對(duì)該方法進(jìn)行驗(yàn)證,實(shí)驗(yàn)結(jié)果表明該方法在全程速度下效果良好。 純分享帖,點(diǎn)擊下方附件免費(fèi)獲取完整資料~~~ *附件:無(wú)刷電機(jī)小波神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)子位置檢測(cè)方法的研究.pdf
    發(fā)表于 06-25 13:06

    英特爾銳炫Pro B系列,邊緣AI的“智能引擎”

    2025年6月19日,上?!?在MWC 25上海期間,英特爾展示了一幅由英特爾銳炫? Pro B系列GPU所驅(qū)動(dòng)的“實(shí)時(shí)響應(yīng)、安全高效、成本可控”的邊緣AI圖景。 英特爾客戶(hù)端計(jì)算事
    的頭像 發(fā)表于 06-20 17:32 ?1117次閱讀
    <b class='flag-5'>英特爾</b>銳炫Pro B系列,邊緣<b class='flag-5'>AI</b>的“智能引擎”

    直擊Computex 2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    B60和英特爾銳炫Pro B50 GPU,AI加速器產(chǎn)品—英特爾Gaudi 3 AI加速器。 英特爾副總裁兼客戶(hù)端顯卡總經(jīng)理Vivian
    的頭像 發(fā)表于 05-21 00:57 ?7857次閱讀
    直擊Computex 2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4倍

    直擊Computex2025:英特爾重磅發(fā)布新一代GPU,圖形和AI性能躍升3.4倍

    5月19日,在Computex 2025上,英特爾發(fā)布了最新全新圖形處理器(GPU)和AI加速器產(chǎn)品系列。包括全新英特爾銳炫? Pro B系列GPU——英特爾銳炫Pro B60和
    的頭像 發(fā)表于 05-20 12:27 ?5755次閱讀
    直擊Computex2025:<b class='flag-5'>英特爾</b>重磅發(fā)布新一代GPU,圖形和<b class='flag-5'>AI</b><b class='flag-5'>性能</b>躍升3.4倍

    英特爾發(fā)布全新GPU,AI和工作站迎來(lái)新選擇

    英特爾推出面向準(zhǔn)專(zhuān)業(yè)用戶(hù)和AI開(kāi)發(fā)者的英特爾銳炫Pro GPU系列,發(fā)布英特爾? Gaudi 3 AI
    發(fā)表于 05-20 11:03 ?1948次閱讀
    射洪县| 涞源县| 曲麻莱县| 织金县| 会宁县| 丰原市| 荔浦县| 长丰县| 和顺县| 新化县| 柏乡县| 新民市| 乐安县| 敦煌市| 张掖市| 鄂温| 长治县| 专栏| 大名县| 孝义市| 长白| 万盛区| 赤壁市| 兴和县| 囊谦县| 莱西市| 华安县| 宁夏| 石屏县| 永宁县| 蒲江县| 教育| 宜黄县| 中江县| 长白| 桓仁| 新龙县| 克拉玛依市| 桃园县| 同江市| 赣榆县|