日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

通過GPU加速機(jī)器學(xué)習(xí)

電子設(shè)計(jì) ? 來源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2022-02-10 17:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

早期的機(jī)器學(xué)習(xí)以搜索為基礎(chǔ),主要依靠進(jìn)行過一定優(yōu)化的暴力方法。但是隨著機(jī)器學(xué)習(xí)逐漸成熟,它開始專注于加速技術(shù)已經(jīng)很成熟的統(tǒng)計(jì)方法和優(yōu)化問題。同時(shí)深度學(xué)習(xí)的問世更是帶來原本可能無法實(shí)現(xiàn)的優(yōu)化方法。本文將介紹現(xiàn)代機(jī)器學(xué)習(xí)如何找到兼顧規(guī)模和速度的新方法。

AI領(lǐng)域的轉(zhuǎn)變

在本系列的第1部分中,我們探討了AI的一些歷史,以及從Lisp到現(xiàn)代編程語言以及深度學(xué)習(xí)等新型計(jì)算智能范式的歷程。我們還討論了人工智能的早期應(yīng)用,它們依賴于經(jīng)過優(yōu)化的搜索形式、在海量數(shù)據(jù)集上進(jìn)行訓(xùn)練的現(xiàn)代神經(jīng)網(wǎng)絡(luò)架構(gòu),同時(shí)解決了十年前還被認(rèn)為不可能的難題。然而目前仍有兩大難題有待解決,即:如何進(jìn)一步加速這些應(yīng)用,以及將它們限制在智能手機(jī)這樣的功耗優(yōu)化環(huán)境中。

今天,深度學(xué)習(xí)成為了多數(shù)加速技術(shù)的重點(diǎn)研究對(duì)象。深度學(xué)習(xí)是一種神經(jīng)網(wǎng)絡(luò)架構(gòu),它依賴于多層神經(jīng)網(wǎng)絡(luò),其中的每一層都可以支持不同的功能以進(jìn)行特征檢測(cè)。這些深層神經(jīng)網(wǎng)絡(luò)依賴于可方便運(yùn)用并行計(jì)算的矢量運(yùn)算, 并為神經(jīng)網(wǎng)絡(luò)層分布式計(jì)算以及同層諸多神經(jīng)元并行計(jì)算創(chuàng)造了條件。

通過GPU加速機(jī)器學(xué)習(xí)

圖形處理單元(GPU)最初并不是用于加速深度學(xué)習(xí)應(yīng)用。GPU是一種特殊的設(shè)備,用于加速輸出到顯示設(shè)備的幀緩沖區(qū)(內(nèi)存)的構(gòu)建。它將渲染后的圖像存入幀緩沖區(qū),而不是依靠處理器來完成。GPU由數(shù)以千計(jì)的獨(dú)立內(nèi)核組成,它們并行運(yùn)行并執(zhí)行矢量運(yùn)算等特定類型的計(jì)算。盡管最初GPU專為視頻應(yīng)用而設(shè)計(jì),但人們發(fā)現(xiàn)它們也可以加速矩陣乘法等科學(xué)計(jì)算。

開發(fā)人員既可以借助于GPU供應(yīng)商提供的API將GPU處理功能集成到應(yīng)用中,也可以采用適用于諸多不同環(huán)境的標(biāo)準(zhǔn)軟件包方式。R編程語言和編程環(huán)境包含與GPU協(xié)同工作來加快處理速度的軟件包,例如gputools、gmatrix和gpuR。GPU也可以通過numba軟件包或Theano等各種庫(kù)借助于Python進(jìn)行編程。

通過這些軟件包,任何有意將GPU加速應(yīng)用于機(jī)器學(xué)習(xí)的人都可以達(dá)成愿望。但是工程師們還在研究更專門的方法。2019年,英特爾?以20億美元的價(jià)格收購(gòu)了Habana Labs, 一家致力于為服務(wù)器中的機(jī)器學(xué)習(xí)加速器開發(fā)定制芯片的公司。此外,英特爾還于2017年以150億美元收購(gòu)了自動(dòng)駕駛芯片技術(shù)企業(yè)Mobileye。

定制芯片和指令

除了服務(wù)器和臺(tái)式機(jī)中的GPU加速之外,用于機(jī)器學(xué)習(xí)的加速器正在試圖超越傳統(tǒng)平臺(tái),進(jìn)軍功耗受限的嵌入式設(shè)備和智能手機(jī)。這些加速器形式多樣,包括U盤、API、智能手機(jī)神經(jīng)網(wǎng)絡(luò)加速器以及用于深度學(xué)習(xí)加速的矢量指令等。

適用于智能手機(jī)的深度學(xué)習(xí)

深度學(xué)習(xí)工具包已經(jīng)從PC端延伸到智能手機(jī),可為存在更多限制的網(wǎng)絡(luò)提供支持。TensorFlow Lite和Core ML等框架已經(jīng)部署在用于機(jī)器學(xué)習(xí)應(yīng)用的移動(dòng)設(shè)備上。Apple?最近發(fā)布了A12 Bionic芯片,這款芯片包括一個(gè)8核神經(jīng)網(wǎng)絡(luò)引擎,用于開發(fā)更加節(jié)能的神經(jīng)網(wǎng)絡(luò)應(yīng)用, 從而擴(kuò)展Apple智能手機(jī)上的深度學(xué)習(xí)應(yīng)用。

Google發(fā)布了適用于Android? 8.1并具有機(jī)器學(xué)習(xí)功能的神經(jīng)網(wǎng)絡(luò)API (NNAPI), 目前已應(yīng)用于Google Lens自然語言處理和圖像識(shí)別背景下的Google Assistant。NNAPI與其他深度學(xué)習(xí)工具包相似,但它是針對(duì)Android智能手機(jī)環(huán)境及其資源限制而構(gòu)建的。

深度學(xué)習(xí)USB

英特爾發(fā)布了其新版神經(jīng)計(jì)算棒,以U盤的形式加速深度學(xué)習(xí)應(yīng)用。TensorFlow、Caffe和PyTorch等眾多機(jī)器學(xué)習(xí)框架都可以使用它。當(dāng)沒有GPU可用時(shí),這將是一個(gè)不錯(cuò)的選擇,同時(shí)還可以快速構(gòu)建深度學(xué)習(xí)應(yīng)用原型。

深度學(xué)習(xí)指令

最后,在機(jī)器學(xué)習(xí)計(jì)算從CPU轉(zhuǎn)移到GPU的同時(shí),英特爾使用新的指令優(yōu)化了其Xeon指令集,來加速深度學(xué)習(xí)。這些被稱為AVX-512擴(kuò)展的新指令(所謂的矢量神經(jīng)網(wǎng)絡(luò)指令或VNNi)提高了卷積神經(jīng)網(wǎng)絡(luò)運(yùn)算的處理量。

總結(jié)

GPU在機(jī)器學(xué)習(xí)中的應(yīng)用實(shí)現(xiàn)了在眾多應(yīng)用中構(gòu)建和部署大規(guī)模深度神經(jīng)網(wǎng)絡(luò)的能力。機(jī)器學(xué)習(xí)框架使構(gòu)建深度學(xué)習(xí)應(yīng)用變得簡(jiǎn)單。智能手機(jī)供應(yīng)商也不甘人后,為受到諸多限制的應(yīng)用集成了高能效的神經(jīng)網(wǎng)絡(luò)加速器(以及用于定制應(yīng)用的API現(xiàn)在市面上還有其他可轉(zhuǎn)移到USB硬件上的加速器,許多新的初創(chuàng)公司也在加大加速器領(lǐng)域的投入,為未來機(jī)器學(xué)習(xí)應(yīng)用做準(zhǔn)備。

審核編輯:何安

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136101
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    GPU負(fù)重前行:一組實(shí)驗(yàn)看懂視頻色彩空間轉(zhuǎn)換的真相

    處理海量圖形數(shù)據(jù)。視頻處理涉及解碼、編碼、轉(zhuǎn)碼、特效、渲染等重負(fù)載任務(wù),傳統(tǒng)CPU逐個(gè)處理效率低下,GPU通過硬件加速釋放CPU資源,成為視頻處理的性能擔(dān)當(dāng)。實(shí)測(cè)對(duì)
    的頭像 發(fā)表于 04-17 11:35 ?115次閱讀
    <b class='flag-5'>GPU</b>負(fù)重前行:一組實(shí)驗(yàn)看懂視頻色彩空間轉(zhuǎn)換的真相

    基于openEuler平臺(tái)的CPU、GPU與FPGA異構(gòu)加速實(shí)戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計(jì)算需求的增長(zhǎng),單一 CPU 已無法滿足低延遲、高吞吐量的計(jì)算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出色,能夠高效調(diào)度 CPU、GPU、FPGA 及 AI 加速器,實(shí)現(xiàn)異構(gòu)計(jì)算協(xié)同。
    的頭像 發(fā)表于 04-08 11:02 ?913次閱讀
    基于openEuler平臺(tái)的CPU、<b class='flag-5'>GPU</b>與FPGA異構(gòu)<b class='flag-5'>加速</b>實(shí)戰(zhàn)

    RSoft GPU加速技術(shù)重塑光子元件設(shè)計(jì)效率革命

    設(shè)計(jì)效率。為了解決這個(gè)問題,RSoft 光子器件工具的 FullWAVE FDTD 模組中引入 GPU 加速,通過 NVIDIA GPU 的平行運(yùn)算能力,使得模擬速度相比 CPU 計(jì)算
    的頭像 發(fā)表于 01-12 14:09 ?439次閱讀
    RSoft <b class='flag-5'>GPU</b><b class='flag-5'>加速</b>技術(shù)重塑光子元件設(shè)計(jì)效率革命

    沐曦股份GPU加速技術(shù)助力藥物研發(fā)降本增效

    沐曦股份科學(xué)計(jì)算團(tuán)隊(duì)近期取得突破性進(jìn)展,成功將主流分子動(dòng)力學(xué)模擬引擎GROMACS中的FEP計(jì)算全流程部署于GPU執(zhí)行,并實(shí)現(xiàn)2.5倍性能提升,相關(guān)成果獲得GROMACS官方團(tuán)隊(duì)的高度認(rèn)可,該GPU
    的頭像 發(fā)表于 12-02 15:58 ?911次閱讀

    如何通過交替式幾何處理實(shí)現(xiàn)更優(yōu)的多核?GPU?擴(kuò)展

    在理論上,通過增加更多GPU核心來提升性能似乎很簡(jiǎn)單:核心越多,性能越強(qiáng)。但在實(shí)踐中,這是圖形架構(gòu)領(lǐng)域最棘手的挑戰(zhàn)之一。雖然某些工作負(fù)載因其獨(dú)立特性能實(shí)現(xiàn)良好擴(kuò)展,但另一些工作負(fù)載(尤其是幾何
    的頭像 發(fā)表于 12-01 10:12 ?803次閱讀
    如何<b class='flag-5'>通過</b>交替式幾何處理實(shí)現(xiàn)更優(yōu)的多核?<b class='flag-5'>GPU</b>?擴(kuò)展

    FPGA和GPU加速的視覺SLAM系統(tǒng)中特征檢測(cè)器研究

    特征檢測(cè)是SLAM系統(tǒng)中常見但耗時(shí)的模塊,隨著SLAM技術(shù)日益廣泛應(yīng)用于無人機(jī)等功耗受限平臺(tái),其效率優(yōu)化尤為重要。本文首次針對(duì)視覺SLAM流程開展硬件加速特征檢測(cè)器的對(duì)比研究,通過對(duì)比現(xiàn)代SoC平臺(tái)
    的頭像 發(fā)表于 10-31 09:30 ?892次閱讀
    FPGA和<b class='flag-5'>GPU</b><b class='flag-5'>加速</b>的視覺SLAM系統(tǒng)中特征檢測(cè)器研究

    NVIDIA Isaac Lab推動(dòng)機(jī)器人技術(shù)突破

    Isaac Lab 是 Isaac Gym 的替代版本,該框架已將 GPU 原生機(jī)器人仿真擴(kuò)展至大規(guī)模多模態(tài)學(xué)習(xí)的全新領(lǐng)域。Isaac Lab 整合了 GPU 并行的物理真實(shí)的仿真、逼
    的頭像 發(fā)表于 10-21 11:20 ?1365次閱讀

    Imagination GPU 驅(qū)動(dòng)更新:新增多項(xiàng) Vulkan 與 OpenCL 擴(kuò)展支持

    整理了本次更新的重點(diǎn)內(nèi)容。Vulkan協(xié)作矩陣(CooperativeMatrix)支持為加速圖形后處理、神經(jīng)著色器、物理仿真以及GPU上的機(jī)器學(xué)習(xí)推理,DDK25
    的頭像 發(fā)表于 10-13 09:21 ?1067次閱讀
    Imagination <b class='flag-5'>GPU</b> 驅(qū)動(dòng)更新:新增多項(xiàng) Vulkan 與 OpenCL 擴(kuò)展支持

    NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南

    NVIDIA Isaac Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理 AI 功能和由 GPU 驅(qū)動(dòng)的物理仿真,縮小仿真與現(xiàn)實(shí)世界之間的差距。
    的頭像 發(fā)表于 09-23 17:15 ?2660次閱讀
    NVIDIA Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點(diǎn)訓(xùn)練指南

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    FPGA在機(jī)器學(xué)習(xí)中的具體應(yīng)用

    隨著機(jī)器學(xué)習(xí)和人工智能技術(shù)的迅猛發(fā)展,傳統(tǒng)的中央處理單元(CPU)和圖形處理單元(GPU)已經(jīng)無法滿足高效處理大規(guī)模數(shù)據(jù)和復(fù)雜模型的需求。FPGA(現(xiàn)場(chǎng)可編程門陣列)作為一種靈活且高效的硬件
    的頭像 發(fā)表于 07-16 15:34 ?3115次閱讀

    通過NVIDIA Cosmos模型增強(qiáng)機(jī)器人學(xué)習(xí)

    通用機(jī)器人的時(shí)代已經(jīng)到來,這得益于機(jī)械電子技術(shù)和機(jī)器人 AI 基礎(chǔ)模型的進(jìn)步。但目前機(jī)器人技術(shù)的發(fā)展仍面臨一個(gè)關(guān)鍵挑戰(zhàn):機(jī)器人需要大量的訓(xùn)練數(shù)據(jù)來掌握諸如組裝和檢查之類的技能,而手動(dòng)演
    的頭像 發(fā)表于 07-14 11:49 ?1331次閱讀
    <b class='flag-5'>通過</b>NVIDIA Cosmos模型增強(qiáng)<b class='flag-5'>機(jī)器人學(xué)習(xí)</b>

    硅谷GPU云服務(wù)器是什么意思?使用指南詳解

    硅谷GPU云服務(wù)器本質(zhì)上是一種IaaS(基礎(chǔ)設(shè)施即服務(wù))產(chǎn)品,它將物理服務(wù)器上的GPU資源通過虛擬化技術(shù)分割成可彈性調(diào)配的云服務(wù)。與普通CPU云服務(wù)器相比,GPU服務(wù)器最大的特點(diǎn)是搭載
    的頭像 發(fā)表于 06-16 09:41 ?751次閱讀

    智算加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒有發(fā)現(xiàn),現(xiàn)在越來越多的AI企業(yè)不光用GPU,也不怎么迷信TPU了?他們嘴里多了一個(gè)新詞兒——智算加速卡。
    的頭像 發(fā)表于 06-05 13:39 ?1937次閱讀
    智算<b class='flag-5'>加速</b>卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉<b class='flag-5'>GPU</b>和TPU!
    云林县| 青海省| 北碚区| 毕节市| 全州县| 蕲春县| 绩溪县| 徐水县| 离岛区| 桃园市| 响水县| 陇川县| 临高县| 那坡县| 汨罗市| 涿鹿县| 平顺县| 洪洞县| 元阳县| 彭水| 涞水县| 凌海市| 含山县| 达孜县| 崇明县| 霸州市| 慈溪市| 宝山区| 榆林市| 沈丘县| 柯坪县| 隆回县| 云浮市| 台东县| 大荔县| 页游| 班戈县| 利辛县| 翁源县| 类乌齐县| 墨竹工卡县|