日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

優(yōu)化用于深度學(xué)習(xí)工作負(fù)載的張量程序

DPVg_AI_era ? 來(lái)源:未知 ? 作者:胡薇 ? 2018-05-23 15:32 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

華盛頓大學(xué)計(jì)算機(jī)系博士生陳天奇、以及上海交通大學(xué)和復(fù)旦大學(xué)的研究團(tuán)隊(duì)提出一個(gè)基于學(xué)習(xí)的框架,以優(yōu)化用于深度學(xué)習(xí)工作負(fù)載的張量程序。該研究使用基于機(jī)器學(xué)習(xí)的方法來(lái)自動(dòng)優(yōu)化張量運(yùn)算核心并編譯AI工作負(fù)載,從而可以將最優(yōu)的性能部署到所有硬件。實(shí)驗(yàn)結(jié)果表明,該框架能夠?yàn)榈凸?a href="http://m.sdkjxy.cn/v/tag/132/" target="_blank">CPU,移動(dòng)GPU和服務(wù)器級(jí)GPU提供與最先進(jìn)手工調(diào)優(yōu)庫(kù)相媲美的性能。

深度學(xué)習(xí)在我們的日常生活中已經(jīng)無(wú)處不在。深度學(xué)習(xí)模型現(xiàn)在可以識(shí)別圖像,理解自然語(yǔ)言,玩游戲,以及自動(dòng)化系統(tǒng)決策(例如設(shè)備放置和索引)。張量算符(tensor operators),如矩陣乘法和高維卷積,是深度學(xué)習(xí)模型的基本組成部分。

可擴(kuò)展的學(xué)習(xí)系統(tǒng)依賴于手動(dòng)優(yōu)化的高性能張量操作庫(kù),如cuDNN。這些庫(kù)針對(duì)較窄范圍的硬件進(jìn)行了優(yōu)化。為了優(yōu)化張量算符,程序員需要從邏輯上等價(jià)的許多實(shí)現(xiàn)中進(jìn)行選擇,但由于線程,內(nèi)存重用, pipelining和其他硬件因素的不同,性能上的差別很大。

支持多種硬件后端需要巨大的工程努力。即使在當(dāng)前支持的硬件上,深度學(xué)習(xí)框架和模型的開(kāi)發(fā)也從根本上受到庫(kù)中優(yōu)化操作符設(shè)置的限制,阻止了諸如操作符熔合(operator fusion)之類的優(yōu)化,從而產(chǎn)生不受支持的操作符。

針對(duì)這個(gè)問(wèn)題,華盛頓大學(xué)計(jì)算機(jī)系博士生陳天奇、以及上海交通大學(xué)和復(fù)旦大學(xué)的研究團(tuán)隊(duì)提出一個(gè)基于學(xué)習(xí)的框架,以優(yōu)化用于深度學(xué)習(xí)工作負(fù)載的張量程序( tensor programs)。

摘要

我們提出一個(gè)基于學(xué)習(xí)的框架,以優(yōu)化用于深度學(xué)習(xí)工作負(fù)載的張量程序( tensor programs)。矩陣乘法和高維卷積等張量算符( tensor operators)的高效實(shí)現(xiàn)是有效的深度學(xué)習(xí)系統(tǒng)的關(guān)鍵。然而,現(xiàn)有的系統(tǒng)依賴于手工優(yōu)化的庫(kù),如cuDNN,這些庫(kù)只有很少的服務(wù)器級(jí)GPU能很好地支持。對(duì)硬件有要求的操作庫(kù)的依賴限制了高級(jí)圖形優(yōu)化的適用性,并且在部署到新的硬件目標(biāo)時(shí)會(huì)產(chǎn)生巨大的工程成本。我們利用學(xué)習(xí)來(lái)消除這種工程負(fù)擔(dān)。我們學(xué)習(xí)了領(lǐng)域特定的統(tǒng)計(jì)成本模型,以指導(dǎo)在數(shù)十億可能的程序變體上搜索張量算符的實(shí)現(xiàn)。我們通過(guò)跨工作負(fù)載的有效模型遷移來(lái)進(jìn)一步加快搜索速度。

實(shí)驗(yàn)結(jié)果表明,我們的框架能夠?yàn)榈凸腃PU,移動(dòng)GPU和服務(wù)器級(jí)GPU提供與最先進(jìn)手工調(diào)優(yōu)庫(kù)相媲美的性能。

學(xué)習(xí)優(yōu)化張量程序問(wèn)題的形式化方法

我們提出以下問(wèn)題:我們是否可以通過(guò)學(xué)習(xí)來(lái)減輕這種工程負(fù)擔(dān),并自動(dòng)優(yōu)化給定硬件平臺(tái)的張量算符程序?本論文為這個(gè)問(wèn)題提供了肯定的答案。我們建立了統(tǒng)計(jì)成本模型來(lái)預(yù)測(cè)給定的低級(jí)程序的程序運(yùn)行時(shí)間。這些成本模型指導(dǎo)了對(duì)可能程序空間的探索。我們的成本模型使用可遷移的表示形式,可以在不同的工作負(fù)載之間進(jìn)行泛化,以加速搜索。這一工作的貢獻(xiàn)如下:

我們提供了學(xué)習(xí)優(yōu)化張量程序問(wèn)題的一種形式化方法,并總結(jié)了其關(guān)鍵特征。

我們提出了一個(gè)基于機(jī)器學(xué)習(xí)的框架來(lái)解決這個(gè)新問(wèn)題。

我們使用遷移學(xué)習(xí)將優(yōu)化速度進(jìn)一步提高2倍至10倍。

我們?cè)谶@個(gè)框架中提供了詳細(xì)的組件設(shè)計(jì)選擇和實(shí)證分析。

在實(shí)際的深度學(xué)習(xí)工作負(fù)載的實(shí)驗(yàn)結(jié)果表明,我們的框架提供的端到端性能改進(jìn)比現(xiàn)有框架好1.2倍至3.8倍。

圖1:該問(wèn)題的一個(gè)例子。 對(duì)于給定的張量算符規(guī)范 ,有多種可能的低級(jí)別程序?qū)崿F(xiàn),每種實(shí)現(xiàn)都有不同的loop順序, tiling 大小以及其他選項(xiàng)。每個(gè)選項(xiàng)都創(chuàng)建一個(gè)具有不同性能的邏輯等效程序。我們的問(wèn)題是探索程序空間并找到一個(gè)優(yōu)化的程序。

圖2:學(xué)習(xí)優(yōu)化張量程序框架的概覽

學(xué)習(xí)優(yōu)化張量程序算法

圖3:編碼低級(jí)別循環(huán)AST的可能方法的示例

表1:?jiǎn)蝏atch的ResNet-18推理中所有conv2d操作符的配置。H,W表示高度和寬度,IC表示輸入通道,OC表示輸出通道,K表示 kernel大小,以及S表示stride大小。

討論和結(jié)論

我們提出了一種基于機(jī)器學(xué)習(xí)的框架來(lái)自動(dòng)優(yōu)化深度學(xué)習(xí)系統(tǒng)中張量算符的實(shí)現(xiàn)。我們的統(tǒng)計(jì)成本模型允許在工作負(fù)載之間進(jìn)行有效的模型共享,并通過(guò)模型遷移加速優(yōu)化過(guò)程。這個(gè)新方法的優(yōu)秀實(shí)驗(yàn)結(jié)果顯示了對(duì)深度學(xué)習(xí)部署的好處。

在我們的解決方案框架之外,這個(gè)新問(wèn)題的具體特征使它成為相關(guān)領(lǐng)域創(chuàng)新的一個(gè)理想測(cè)試平臺(tái),如神經(jīng)程序建模、貝葉斯優(yōu)化、遷移學(xué)習(xí)和強(qiáng)化學(xué)習(xí)。

在系統(tǒng)方面,學(xué)習(xí)優(yōu)化張量程序可以使更多的融合操作符、數(shù)據(jù)布局和數(shù)據(jù)類型跨不同的硬件后端。這些改進(jìn)對(duì)于改進(jìn)深度學(xué)習(xí)系統(tǒng)至關(guān)重要。我們將開(kāi)放我們的實(shí)驗(yàn)框架,以鼓勵(lì)在這些方向進(jìn)行更多的研究。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:陳天奇團(tuán)隊(duì)新研究:自動(dòng)優(yōu)化深度學(xué)習(xí)工作負(fù)載

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    Atmel M90E26:高性能單相寬量程電能計(jì)量芯片的深度剖析

    Atmel M90E26:高性能單相寬量程電能計(jì)量芯片的深度剖析 作為電子工程師,在設(shè)計(jì)中對(duì)于電能計(jì)量芯片的選擇至關(guān)重要。Atmel M90E26是一款高性能、寬量程的單相電能計(jì)量芯片,能滿足多種
    的頭像 發(fā)表于 04-06 12:15 ?739次閱讀

    MAX1270/MAX1271:多量程、+5V、8通道、串行12位ADC的深度解析

    MAX1270/MAX1271:多量程、+5V、8通道、串行12位ADC的深度解析 在電子設(shè)計(jì)領(lǐng)域,模數(shù)轉(zhuǎn)換器(ADC)是連接模擬世界和數(shù)字世界的關(guān)鍵橋梁。今天我們要深入探討的是Maxim公司
    的頭像 發(fā)表于 04-02 12:40 ?326次閱讀

    MAX1302:8通道、±VREF多量程輸入串行16位ADC的深度解析

    MAX1302:8通道、±VREF多量程輸入串行16位ADC的深度解析 在電子設(shè)計(jì)領(lǐng)域,模擬到數(shù)字的轉(zhuǎn)換是一個(gè)關(guān)鍵環(huán)節(jié),而ADC(模擬 - 數(shù)字轉(zhuǎn)換器)則是實(shí)現(xiàn)這一轉(zhuǎn)換的核心器件。今天,我們將
    的頭像 發(fā)表于 03-31 16:20 ?172次閱讀

    Atmel M90E26:?jiǎn)蜗喔咝阅軐?b class='flag-5'>量程電能計(jì)量IC的深度解析

    Atmel M90E26:?jiǎn)蜗喔咝阅軐?b class='flag-5'>量程電能計(jì)量IC的深度解析 在電子工程師的日常工作中,電能計(jì)量IC是一個(gè)關(guān)鍵的組件,特別是在涉及到單相電能計(jì)量的應(yīng)用場(chǎng)景中。Atmel M90E26作為一款
    的頭像 發(fā)表于 03-30 15:05 ?281次閱讀

    基于 SiC MOSFET 的高頻 LLC 諧振變換器:針對(duì) AI 負(fù)載 0%-200% 瞬態(tài)切換的軟開(kāi)關(guān)失效預(yù)防與可靠性優(yōu)化

    )等人工智能(AI)技術(shù)爆炸性增長(zhǎng)的背景下,超大規(guī)模數(shù)據(jù)中心的基礎(chǔ)設(shè)施正經(jīng)歷著前所未有的重構(gòu)。傳統(tǒng)的云計(jì)算工作負(fù)載往往表現(xiàn)出相對(duì)平穩(wěn)的功率需求,而以深度學(xué)習(xí)訓(xùn)練和海量參數(shù)推理為代表的
    的頭像 發(fā)表于 03-21 20:08 ?364次閱讀
    基于 SiC MOSFET 的高頻 LLC 諧振變換器:針對(duì) AI <b class='flag-5'>負(fù)載</b> 0%-200% 瞬態(tài)切換的軟開(kāi)關(guān)失效預(yù)防與可靠性<b class='flag-5'>優(yōu)化</b>

    青智功率計(jì)變壓器的無(wú)負(fù)載損耗測(cè)量

    對(duì)于變壓器來(lái)說(shuō),減少功率損耗是節(jié)能的一個(gè)重要環(huán)節(jié),作為評(píng)估配電用變壓器等高效化的要素中,變壓器的無(wú)負(fù)載電流和無(wú)負(fù)載損耗實(shí)驗(yàn)中,對(duì)無(wú)負(fù)載的測(cè)量時(shí),電流波形畸變,波峰因數(shù)變高,而功率因數(shù)降低。 因此
    的頭像 發(fā)表于 03-16 17:45 ?713次閱讀
    青智功率計(jì)變壓器的無(wú)<b class='flag-5'>負(fù)載</b>損耗測(cè)量

    簡(jiǎn)儀科技走進(jìn)三所高校開(kāi)展AI助力測(cè)試測(cè)量程序開(kāi)發(fā)實(shí)操課程

    2026年1月14日-16日,簡(jiǎn)儀科技“AI+測(cè)試測(cè)量”高校行落地西北,先后走進(jìn)西安電子科技大學(xué)、西安科技大學(xué)、西北工業(yè)大學(xué)開(kāi)展“AI助力測(cè)試測(cè)量程序開(kāi)發(fā)”實(shí)操課程,并與到訪的西安航空學(xué)院完成校企課程合作交流,以“技術(shù)實(shí)操+場(chǎng)景適配”為核心,推動(dòng)AI與工程教育的深度融合。
    的頭像 發(fā)表于 01-21 16:46 ?1413次閱讀

    機(jī)器學(xué)習(xí)深度學(xué)習(xí)中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    無(wú)論你是剛?cè)腴T還是已經(jīng)從事人工智能模型相關(guān)工作一段時(shí)間,機(jī)器學(xué)習(xí)深度學(xué)習(xí)中都存在一些我們需要時(shí)刻關(guān)注并銘記的常見(jiàn)錯(cuò)誤。如果對(duì)這些錯(cuò)誤置之不理,日后可能會(huì)引發(fā)諸多麻煩!只要我們密切關(guān)注
    的頭像 發(fā)表于 01-07 15:37 ?367次閱讀
    機(jī)器<b class='flag-5'>學(xué)習(xí)</b>和<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>中需避免的 7 個(gè)常見(jiàn)錯(cuò)誤與局限性

    穿孔機(jī)頂頭檢測(cè)儀 機(jī)器視覺(jué)深度學(xué)習(xí)

    ,能適用惡劣工況,在粉塵、高溫、氧化皮等惡劣環(huán)境中均可正常工作。 測(cè)量原理 利用頂頭與周圍的物質(zhì)(水、空氣、導(dǎo)盤等)紅外輻射能量的差異,用熱成像相機(jī)拍攝出清晰的圖片,再通過(guò)深度學(xué)習(xí)短時(shí)間內(nèi)深度
    發(fā)表于 12-22 14:33

    【團(tuán)購(gòu)】獨(dú)家全套珍藏!龍哥LabVIEW視覺(jué)深度學(xué)習(xí)實(shí)戰(zhàn)課(11大系列課程,共5000+分鐘)

    (第10系列)、YOLOv8-Tiny工業(yè)優(yōu)化版(第9系列),滿足產(chǎn)線端設(shè)備算力限制,模型推理速度提升300%。 LabVIEW生態(tài)整合 作為工業(yè)自動(dòng)化領(lǐng)域主流開(kāi)發(fā)環(huán)境,LabVIEW與深度學(xué)習(xí)的集成
    發(fā)表于 12-04 09:28

    【團(tuán)購(gòu)】獨(dú)家全套珍藏!龍哥LabVIEW視覺(jué)深度學(xué)習(xí)實(shí)戰(zhàn)課程(11大系列課程,共5000+分鐘)

    (第10系列)、YOLOv8-Tiny工業(yè)優(yōu)化版(第9系列),滿足產(chǎn)線端設(shè)備算力限制,模型推理速度提升300%。 LabVIEW生態(tài)整合 作為工業(yè)自動(dòng)化領(lǐng)域主流開(kāi)發(fā)環(huán)境,LabVIEW與深度學(xué)習(xí)的集成
    發(fā)表于 12-03 13:50

    【產(chǎn)品介紹】Altair PBS Professional HPC工作負(fù)載管理器和作業(yè)調(diào)度管理系統(tǒng)

    AltairPBSProfessional行業(yè)領(lǐng)先的HPC工作負(fù)載管理器和作業(yè)調(diào)度管理系統(tǒng)PBSProfessional是一款快速、強(qiáng)大的工作負(fù)載管理器和作業(yè)調(diào)度管理系統(tǒng),旨在提高生產(chǎn)
    的頭像 發(fā)表于 09-19 17:03 ?823次閱讀
    【產(chǎn)品介紹】Altair PBS Professional HPC<b class='flag-5'>工作</b><b class='flag-5'>負(fù)載</b>管理器和作業(yè)調(diào)度管理系統(tǒng)

    如何在機(jī)器視覺(jué)中部署深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)

    人士而言往往難以理解,人們也常常誤以為需要扎實(shí)的編程技能才能真正掌握并合理使用這項(xiàng)技術(shù)。事實(shí)上,這種印象忽視了該技術(shù)為機(jī)器視覺(jué)(乃至生產(chǎn)自動(dòng)化)帶來(lái)的潛力,因?yàn)?b class='flag-5'>深度學(xué)習(xí)并非只屬于計(jì)算機(jī)科學(xué)家或程序員。 從頭開(kāi)始:什么
    的頭像 發(fā)表于 09-10 17:38 ?1074次閱讀
    如何在機(jī)器視覺(jué)中部署<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>神經(jīng)網(wǎng)絡(luò)

    如何加速實(shí)時(shí)工作負(fù)載

    對(duì)于需要實(shí)時(shí)響應(yīng)的數(shù)據(jù)中心工作負(fù)載,性能不僅是指原始吞吐量或處理能力。挑戰(zhàn)在于:在保持吞吐量和能效的同時(shí),實(shí)現(xiàn)確定性時(shí)延。
    的頭像 發(fā)表于 09-10 15:36 ?821次閱讀

    思嵐科技AI工業(yè)機(jī)器人開(kāi)放底盤Phoebus P350全新發(fā)布:深度學(xué)習(xí)導(dǎo)航+300KG負(fù)載

    工業(yè)4.0時(shí)代,智能搬運(yùn)的“底盤力”決定效率天花板。 SLAMTEC全新推出 Phoebus P350工業(yè)級(jí)機(jī)器人底盤 ,以 “開(kāi)放AI架構(gòu)+深度學(xué)習(xí)導(dǎo)航” 為核心,融合300KG超強(qiáng)負(fù)載、60cm
    的頭像 發(fā)表于 05-12 11:33 ?1647次閱讀
    思嵐科技AI工業(yè)機(jī)器人開(kāi)放底盤Phoebus P350全新發(fā)布:<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>導(dǎo)航+300KG<b class='flag-5'>負(fù)載</b>
    泰顺县| 舟山市| 辽阳县| 兴义市| 文昌市| 屏山县| 成都市| 黔西县| 塔城市| 延边| 赣榆县| 忻州市| 塔河县| 兴文县| 玉林市| 呼图壁县| 慈利县| 周宁县| 凌云县| 新邵县| 临朐县| 通化县| 昭平县| 崇信县| 盐津县| 龙山县| 江津市| 宜川县| 东乡族自治县| 若尔盖县| 正宁县| 大竹县| 潮州市| 宜阳县| 高阳县| 房产| 罗山县| 湘阴县| 松桃| 年辖:市辖区| 农安县|