日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用于智能邊緣計算的嵌入式深度學(xué)習(xí)推理解決方案

我快閉嘴 ? 來源:千家網(wǎng) ? 作者:蒙光偉 ? 2020-09-04 12:21 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過去的幾年中,人工智能領(lǐng)域已進入高速增長階段,這在很大程度上受諸如深度學(xué)習(xí)(DL)和強化學(xué)習(xí)(RL)之類的機器學(xué)習(xí)方法的推動。這些技術(shù)的組合展示了在解決各種問題方面的空前性能,這些問題從以超人的角度玩Go到像專家一樣診斷癌癥。

在我們以前的博客中,智能物聯(lián)網(wǎng)和霧計算趨勢以及物聯(lián)網(wǎng)中無處不在的計算機視覺的興起,我們談到了物聯(lián)網(wǎng)中DL的一些有趣用例。應(yīng)用將是廣泛而深入的。它們將在未來幾十年內(nèi)刺激對新型處理器的需求。

深度學(xué)習(xí)工作流程概述

DL / RL創(chuàng)新正以驚人的速度發(fā)生(每年在眾多與AI相關(guān)的會議上發(fā)表數(shù)千篇有關(guān)新算法的論文)。盡管預(yù)測最終的解決方案為時尚早,但硬件公司正在爭相構(gòu)建處理器、工具和框架。他們試圖利用多年研究人員的經(jīng)驗來確定DL工作流程中的痛點和瓶頸。

訓(xùn)練DL模型的平臺

讓我們從培訓(xùn)平臺開始?;趫D形處理單元(GPU)的系統(tǒng)通常是訓(xùn)練高級DL模型的選擇。Nvidia早已意識到將GPU用于通用高性能計算的優(yōu)勢。

GPU有數(shù)百個計算核心,它們支持大量的硬件線程和高吞吐量的浮點計算。 Nvidia開發(fā)了Compute Unified Device Architecture(CUDA)編程框架,使GPU友好地供科學(xué)家和機器學(xué)習(xí)專家使用。

CUDA工具鏈改善了耗時問題,為研究人員提供了一種靈活而友好的方式來實現(xiàn)高度復(fù)雜的算法。幾年前,Nvidia恰當(dāng)?shù)匕l(fā)現(xiàn)了DL的機會,并為大多數(shù)DL運營不斷開發(fā)CUDA支持。 Caffe、Torch和Tensorflow等標準框架均支持CUDA。

在AWS之類的云服務(wù)中,開發(fā)人員可以選擇使用CPU還是GPU(更具體地說是Nvidia GPU)。平臺的選擇取決于神經(jīng)網(wǎng)絡(luò)的復(fù)雜性、預(yù)算和時間。基于GPU的系統(tǒng)通??梢员菴PU減少訓(xùn)練時間幾倍,但價格更高。

GPU / CPU的替代品

替代品來了。 Khronos在2009年提出了OpenCL,這是一種用于在各種硬件(例如CPU、GPU、DSPFPGA)上進行并行計算的開放標準。它將使其他處理器(如AMD GPU)進入DL培訓(xùn)市場,為開發(fā)人員提供更多選擇。

但是,它在DL庫支持方面仍落后于CUDA。希望這種情況在未來幾年內(nèi)會有所改善。英特爾還通過收購Nervana開發(fā)了針對DL培訓(xùn)定制的處理器。

DL推理的競爭格局

DL推理是一個競爭激烈的市場。通??梢愿鶕?jù)用例的要求在多個級別上部署應(yīng)用:

云/企業(yè):圖像分類、網(wǎng)絡(luò)安全、文本分析、NLP等。

智能網(wǎng)關(guān):生物識別、語音識別、智能代理等。

邊緣端點:移動設(shè)備、智能相機等。

云推理

在Google、Facebook、百度或阿里巴巴等互聯(lián)網(wǎng)巨頭的大力推動下,云推理市場將實現(xiàn)巨大的增長。例如,Google Cloud和Microsoft Azure提供了非常強大的圖像分類、自然語言處理和面部識別API,開發(fā)人員可以輕松地將其集成到他們的云應(yīng)用中。

云推理平臺將需要可靠地支持數(shù)百萬并發(fā)用戶。擴展吞吐量的能力至關(guān)重要。此外,降低能耗是控制服務(wù)運營成本的另一個重中之重。

在云推理空間上,除GPU外,數(shù)據(jù)中心還使用FPGA或定制處理器來使云推理應(yīng)用更具成本效益和功效。例如,Microsoft Project Brainwave使用英特爾FPGA來證明在運行諸如CNN、LSTM等的DL算法時的強大性能和靈活性。

FPGA具有優(yōu)勢。硬件邏輯、計算內(nèi)核和內(nèi)存配置可針對特定類型的神經(jīng)網(wǎng)絡(luò)進行定制,從而使其更有效地處理預(yù)訓(xùn)練模型。但是,一個缺點是與CPU或CUDA相比編程困難。如上一節(jié)所述,OpenCL將有助于使FPGA對軟件開發(fā)人員更加友好。

除了FPGA之外,Google還制造了定制的處理器,稱為TPU。它是一種專注于高效矩陣計算的ASIC。但是,僅Google自己的服務(wù)支持該功能。

用于智能邊緣計算的嵌入式DL推理

在邊緣,DL推理解決方案需要解決針對不同用例和市場的多種需求。

自動駕駛平臺

自動駕駛平臺目前是最熱門的市場,最新的DL和RL方法正在應(yīng)用中,以實現(xiàn)最高水平的自動駕駛。 Nvidia一直領(lǐng)導(dǎo)著從Tegra到Xavier的幾類DL SoC市場。 例如,Xavier SoC內(nèi)置于Nvidia的Drive PX平臺中,該平臺可實現(xiàn)多達320個TFLOP。 它的目標是5級自動駕駛。

移動處理器

另一個快速增長的領(lǐng)域是移動應(yīng)用處理器。 DL啟用了智能手機上以前無法實現(xiàn)的新功能。 一個例子是蘋果將神經(jīng)引擎集成到A11 Bionic芯片中,從而使其能夠在iPhone X上添加高精度面部鎖定。

中國芯片制造海思半導(dǎo)體還發(fā)布了麒麟970處理器,該處理器具有神經(jīng)處理單元(NPU)。 華為的一些最新智能手機(圖4)已經(jīng)使用新的DL處理器進行了設(shè)計。 例如,使用NPU,智能手機相機會“知道”正在查看的內(nèi)容,并會根據(jù)場景的主體(例如人、植物、風(fēng)景等)自動調(diào)整相機設(shè)置。

新架構(gòu)

值得一提的是,有一類新的處理器,稱為神經(jīng)形態(tài)處理器,它緊密模仿人類大腦神經(jīng)元和突觸的機制。他們可以實現(xiàn)一種稱為“脈沖神經(jīng)網(wǎng)絡(luò)(SNN)”的神經(jīng)網(wǎng)絡(luò),它可以在空間和時間域中學(xué)習(xí)。

原則上,與現(xiàn)有的DL架構(gòu)相比,它們具有更高的能源效率,并且在解決在線機器學(xué)習(xí)問題方面具有優(yōu)勢。

IBM的TrueNorth和英特爾的Loihi基于神經(jīng)形態(tài)架構(gòu)。研究人員正在探索這些芯片的功能,顯示出一些潛力。目前尚不清楚何時將新型處理器準備用于廣泛的商業(yè)用途。諸如Applied Brain Research和Brainchip之類的許多初創(chuàng)公司也專注于這一領(lǐng)域,開發(fā)工具和IP。

這是一個有趣的時代

在短短的幾年內(nèi),AI / DL / RL / ML已成為許多行業(yè)的重要工具。從IP、處理器、系統(tǒng)設(shè)計到工具鏈和軟件方法論的底層生態(tài)系統(tǒng)已經(jīng)進入了快速的創(chuàng)新周期。新的處理器將支持許多以前無法實現(xiàn)的新物聯(lián)網(wǎng)應(yīng)用。

但是,物聯(lián)網(wǎng)和機器學(xué)習(xí)應(yīng)用仍在不斷發(fā)展。芯片設(shè)計人員和開發(fā)人員將需要幾代處理器才能提出正確的架構(gòu)組合,從而滿足各種市場的需求。在以后的文章中,我們將更深入地研究各種垂直領(lǐng)域的計算平臺。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20344

    瀏覽量

    255360
  • 物聯(lián)網(wǎng)
    +關(guān)注

    關(guān)注

    2950

    文章

    48156

    瀏覽量

    418895
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    67

    文章

    8567

    瀏覽量

    137268
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5610

    瀏覽量

    124659
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    嵌入式人工智能課程(華清遠見)

    嵌入式 AI 編譯器優(yōu)化:華清遠見課程,解鎖極致端側(cè)性能 隨著人工智能從云端全面向邊緣側(cè)和終端側(cè)下沉,“萬物智聯(lián)”的時代已經(jīng)悄然到來。然而,在這股浪潮背后,隱藏著一個巨大的技術(shù)鴻溝:在算力受限
    發(fā)表于 04-16 18:47

    紫光閃芯重磅發(fā)布EC100系列嵌入式eMMC產(chǎn)品

    2026年3月,紫光閃芯重磅發(fā)布專為AI推理邊緣存儲場景打造的嵌入式eMMC EC100系列產(chǎn)品,憑借核心團隊深耕存儲領(lǐng)域的技術(shù)積淀與國內(nèi)完備的產(chǎn)業(yè)鏈協(xié)同優(yōu)勢,定位于中高端嵌入式存儲
    的頭像 發(fā)表于 04-07 11:49 ?1889次閱讀

    虹科 owa5X 無線嵌入式計算機 工業(yè)級邊緣計算終端與車載網(wǎng)關(guān)優(yōu)選

    從工業(yè)級邊緣計算終端到車載高性能邊緣計算網(wǎng)關(guān),從工業(yè)級嵌入式計算機到邊緣
    的頭像 發(fā)表于 02-10 17:08 ?278次閱讀
    虹科 owa5X 無線<b class='flag-5'>嵌入式計算</b>機 工業(yè)級<b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>終端與車載網(wǎng)關(guān)優(yōu)選

    嵌入式單片機開發(fā)學(xué)習(xí)路徑

    嵌入式系統(tǒng)是現(xiàn)代科技的重要組成部分,廣泛應(yīng)用于智能家居、汽車電子、工業(yè)控制、醫(yī)療設(shè)備等領(lǐng)域。學(xué)習(xí)嵌入式單片機開發(fā)不僅能提升個人技能,還能開拓
    發(fā)表于 02-09 15:42

    安富利Edgeboard AI Box解決方案實現(xiàn)邊緣智能部署

    然而,隨著AI模型逐漸輕量化、硬件算力持續(xù)提升以及嵌入式系統(tǒng)日趨成熟,在終端設(shè)備實現(xiàn)高效AI推理正在成為現(xiàn)實。在此趨勢下,邊緣計算已不再只是云端的補充,而是演變?yōu)?/div>
    的頭像 發(fā)表于 12-24 11:46 ?778次閱讀

    從小白到大牛:Linux嵌入式系統(tǒng)開發(fā)的完整指南

    技術(shù)融合:嵌入式開發(fā)常需結(jié)合其他技術(shù)領(lǐng)域,如物聯(lián)網(wǎng)(MQTT 協(xié)議、LwIP 協(xié)議棧)、人工智能邊緣計算、TensorFlow Lite 部署)、實時系統(tǒng)(RT-Linux、Free
    發(fā)表于 12-16 10:42

    系統(tǒng)嵌入式學(xué)習(xí)路線

    嵌入式技術(shù)是各種電子產(chǎn)品的核心技術(shù),也是工業(yè)4.0、遠程醫(yī)療、3D打印等新興產(chǎn)業(yè)的核心技術(shù),具有廣闊的發(fā)展前景。很多計算機、電子信息類專業(yè)的學(xué)生都想把嵌入式開發(fā)作為自己的職業(yè)目標,但是因為嵌入
    發(fā)表于 12-16 07:49

    分享一個嵌入式開發(fā)學(xué)習(xí)路線

    如果你想要學(xué)習(xí)嵌入式開發(fā),我建議按照這個學(xué)習(xí)路線準備: 1. 基礎(chǔ)鋪墊期(1-2個月) 理解嵌入式系統(tǒng)的“硬件基礎(chǔ)”和“編程入門”,能看懂
    發(fā)表于 12-04 11:01

    嵌入式需要掌握哪些核心技能?

    嵌入式需要掌握哪些核心技能? 若想通過學(xué)習(xí)嵌入式技術(shù)提升就業(yè)競爭力,需重點掌握C語言、嵌入式硬件架構(gòu)、RTOS/Linux開發(fā)、通信協(xié)議四大核心技能,并結(jié)合行業(yè)需求積累項目經(jīng)驗。
    發(fā)表于 10-21 16:25

    飛凌嵌入式FCU3501嵌入式控制單元:工業(yè)級邊緣AI計算的“硬核擔(dān)當(dāng)”

    邊緣計算設(shè)備的性能與穩(wěn)定提出了更加嚴苛的要求。飛凌嵌入式推出的FCU3501嵌入式控制單元,正是為這類場景量身打造的“工業(yè)級AI計算引擎”。
    的頭像 發(fā)表于 09-19 08:03 ?7558次閱讀
    飛凌<b class='flag-5'>嵌入式</b>FCU3501<b class='flag-5'>嵌入式</b>控制單元:工業(yè)級<b class='flag-5'>邊緣</b>AI<b class='flag-5'>計算</b>的“硬核擔(dān)當(dāng)”

    邊緣計算嵌入式系統(tǒng):物聯(lián)網(wǎng)發(fā)展的新動力

    引言 隨著物聯(lián)網(wǎng)設(shè)備數(shù)量的持續(xù)增長,數(shù)據(jù)處理需求呈現(xiàn)指數(shù)級上升。傳統(tǒng)的云計算模式在面對實時性、帶寬與安全性要求時逐漸顯得不足。在這種背景下, 邊緣計算嵌入式系統(tǒng)的結(jié)合 ,正在為物聯(lián)網(wǎng)
    的頭像 發(fā)表于 09-05 16:32 ?1205次閱讀

    Axelera AI:邊緣計算加速智能創(chuàng)新解決方案

    。AxeleraAI憑借其卓越的AI加速解決方案,致力于協(xié)助企業(yè)快速部署高性能、低功耗的邊緣計算平臺,廣泛應(yīng)用于智慧城市、智慧交通及工業(yè)檢測等領(lǐng)域。接下來說明AxeleraAI產(chǎn)品特色
    的頭像 發(fā)表于 07-17 11:00 ?1094次閱讀
    Axelera AI:<b class='flag-5'>邊緣</b><b class='flag-5'>計算</b>加速<b class='flag-5'>智能</b>創(chuàng)新<b class='flag-5'>解決方案</b>

    大模型推理顯存和計算量估計方法研究

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)大模型在各個領(lǐng)域得到了廣泛應(yīng)用。然而,大模型的推理過程對顯存和計算資源的需求較高,給實際應(yīng)用帶來了挑戰(zhàn)。
    發(fā)表于 07-03 19:43

    聚徽智控——從嵌入式邊緣計算:平板工控電腦的技術(shù)進化論

    在工業(yè)數(shù)字化轉(zhuǎn)型的浪潮中,平板工控電腦作為核心終端設(shè)備,正經(jīng)歷從嵌入式系統(tǒng)到邊緣計算架構(gòu)的范式革命。這一進化不僅重塑了設(shè)備的技術(shù)形態(tài),更推動了工業(yè)互聯(lián)從“數(shù)據(jù)采集”向“智能決策”的跨越
    的頭像 發(fā)表于 06-13 13:48 ?1041次閱讀

    嵌入式開發(fā)入門指南:從零開始學(xué)習(xí)嵌入式

    特定功能的計算機系統(tǒng),廣泛應(yīng)用于智能家居、工業(yè)控制、醫(yī)療設(shè)備、車載系統(tǒng)等領(lǐng)域。 2. 學(xué)習(xí)嵌入式開發(fā)的前置知識熟悉C語言編程掌握基本的數(shù)據(jù)結(jié)
    發(fā)表于 05-15 09:29
    江城| 湖北省| 祥云县| 枣强县| 巴彦淖尔市| 峨边| 常宁市| 合川市| 富蕴县| 神农架林区| 吉隆县| 商都县| 新安县| 吕梁市| 平湖市| 毕节市| 皮山县| 福鼎市| 荣成市| 衡南县| 怀仁县| 新闻| 营口市| 温泉县| 永德县| 白城市| 洛川县| 长春市| 阿巴嘎旗| 黑山县| 宜兰市| 禹城市| 镇江市| 延津县| 南陵县| 宝兴县| 红河县| 卢龙县| 普兰县| 革吉县| 乐亭县|