日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

專用NPU是發(fā)揮端側(cè)人工智能潛力的捷徑

YCqV_FPGA_EETre ? 來源:cg ? 2019-01-09 09:44 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1971年,第一顆劃時代的大規(guī)模集成電路產(chǎn)品Intel4004出現(xiàn),它使用MOSFET集成電路技術(shù),采用10μm工藝,集成了2300個MOSFET。雖然這顆IC僅僅集成了2300個晶體管,但它標志著人類大規(guī)模集成電路時代正式開啟,而且它開辟了一條提升IC性能的路徑——同樣面積下,要提升性能就要集成更多晶體管,要集成更多晶體管只要升級工藝就可以實現(xiàn)。

自此之后,人類一直就享用著IC工藝升級帶來的紅利。根據(jù)Intel的創(chuàng)始人之一戈登·摩爾(GordonMoore)提出的摩爾定律:集成電路上可容納的晶體管數(shù)目,約每隔18個月便會增加一倍,性能也將提升一倍。50 年來,IC工藝在摩爾定律的指導(dǎo)下飛速發(fā)展,我們也一直在享用工藝技術(shù)升級帶來的好處——性能升級,功耗降低,尺寸越來越小。

但是,當工藝scaling到10nm以下時,由于工藝復(fù)雜度大幅度提升,摩爾定律已經(jīng)趨緩。2018年11月,AMD CTO發(fā)表言論認為摩爾定律已經(jīng)減緩;6月份美國舉辦的DAC大會上,著名計算機領(lǐng)域?qū)<?018圖靈獎獲得者David Patterson(開源CPU RISC-V發(fā)明人之一)也明確認為摩爾定律已經(jīng)減緩;而且,英特爾自己的10nm工藝連續(xù)跳票,不能按時交付新工藝芯片。這些言行都說明,依靠半導(dǎo)體工藝升級帶來IC器件性能提升,已經(jīng)不可能再像以前那樣繼續(xù)維持高速提升了,那該如何提升處理器性能?尤其是提升人工智能的處理效率?

架構(gòu)創(chuàng)新是出路,AI時代需要專用處理單元

David Patterson 認為現(xiàn)在是計算機系統(tǒng)架構(gòu)的黃金時代,單靠工藝升級難以實現(xiàn)大的性能突破,未來處理器必須從架構(gòu)上尋求出口。

而根據(jù)業(yè)內(nèi)眾多半導(dǎo)體專家的觀點,異構(gòu)架構(gòu)是未來IC發(fā)展的必由之路。*** 半導(dǎo)體產(chǎn)業(yè)協(xié)會理事長盧超群博士(Nicky Lu)就認為,異構(gòu)集成設(shè)計系統(tǒng)架構(gòu)(HIDAS, Heterogeneous Integration Design Architecture System)將大量促進IC創(chuàng)新,要提升IC性能就要集成新的異質(zhì)單元。 同理,對于目前熱門的人工智能處理需求來說,通過工藝升級CPU或者GPU、DSPFPGA都不是好辦法,更合理的方案是就集成人工智能處理單元。

人工智能到底需要一種什么樣的處理單元?想要尋找答案,我們可以回頭看看GPU的發(fā)展歷程。

1962年,麻省理工學院的博士伊凡?蘇澤蘭發(fā)表的論文以及他的畫板程序奠定了計算機圖形學的基礎(chǔ)。在隨后的近20年里,計算機圖形學在不斷發(fā)展,但是當時的計算機卻沒有配備專門的圖形處理芯片,圖形處理任務(wù)都是CPU來完成的。

1999年8月,NVIDIA公司發(fā)布了一款代號為NV10的圖形芯片Geforce 256。Geforce 256是圖形芯片領(lǐng)域開天辟地的產(chǎn)品,因為它是第一款提出GPU概念的產(chǎn)品。Geforce 256所采用的核心技術(shù)有“T&L”硬件、立方環(huán)境材質(zhì)貼圖和頂點混合、紋理壓縮和凹凸映射貼圖、雙重紋理四像素256位渲染引擎等。“T&L”硬件的出現(xiàn),讓顯示芯片具備了以前只有高端工作站才有的頂點變換能力,同時期的OpenGL和DirectX 7都提供了硬件頂點變換的編程接口,GPU的概念因此而出現(xiàn)。由此開始,CPU、GPU 才正式確立了各自的屬性和工作內(nèi)容。

從結(jié)構(gòu)上來說,CPU和GPU不同之處體現(xiàn)在他們處理任務(wù)的方式不同。CPU由專為串行任務(wù)而優(yōu)化的幾個核心組成;GPU則由數(shù)以千計的更小、更高效的核心組成,這些核心專為同時處理多任務(wù)而設(shè)計。稍微深入一點來講,CPU和GPU的不同,是因為它們的使命不同。CPU需要很強的通用性來處理各種不同的數(shù)據(jù)類型,同時又要邏輯判斷,又會引入大量的分支跳轉(zhuǎn)中斷的處理,這使CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜。而GPU需要處理的則是類型高度統(tǒng)一、相互依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的計算環(huán)境。因此,GPU和CPU就呈現(xiàn)出非常不同的架構(gòu)。

從GPU的發(fā)展來看,它的出現(xiàn)在于首先要應(yīng)對新的處理需求——圖形處理,其次是要以不同于CPU的架構(gòu)來完成處理效率最大化。這兩點對人工智能處理也有借鑒意義:首先,人工智能處理是不同于CPU和GPU的新處理需求;其次,人工智能處理需要新的架構(gòu),因為無論CPU、GPU還是FPGA都不是最好的架構(gòu),尤其是在手機領(lǐng)域FPGA更不適合。

我們知道,手機是消費電子中最大的品類,在工藝、封裝、集成、架構(gòu)方面都走在行業(yè)最前沿,它的技術(shù)也在引導(dǎo)著整個半導(dǎo)體行業(yè)的發(fā)展。一方面,手機SoC使用最新的工藝制程;另外一方面,手機也是對功耗、面積特別敏感的產(chǎn)品品類。用CPU,GPU這些面向傳統(tǒng)指令計算、浮點運算的計算單元,去執(zhí)行以張量計算為主的AI運算,效率和能效都不能達到最好,同時隨著傳統(tǒng)半導(dǎo)體工藝制程不斷逼近極限,如果還用摩爾定律的增長紅利去滿足日益提升的AI運算量,代價會越來越高。

另外,AI的框架、算法和網(wǎng)絡(luò)模型發(fā)展也非???,如果采用CPU,GPU適配日新月異的AI框架和算子,軟件適配等工作也非常繁多,這不僅為開發(fā)者帶來更高的開發(fā)成本,更同時加大了產(chǎn)品上市的時間成本。如果采用FPGA,雖然人工智能的處理效率會大大提升,但是FPGA的面積和功耗都不適合集成在手機平臺;如果采用DSP,雖然有一定的靈活性,但是效能還不是最大。因此,借鑒GPU的發(fā)展,從最優(yōu)能效角度考慮,手機平臺需要集成專用的NPU,讓專業(yè)的器件干專業(yè)的事情。

專用NPU性能強勁,麒麟芯片引領(lǐng)端側(cè)AI應(yīng)用潮流

毫無疑問,手機平臺需要專用的NPU。在這方面,華為大膽嘗試,在2017年9月率先推出了集成專用NPU處理單元的麒麟970。麒麟 970采用了創(chuàng)新的HiAI移動計算架構(gòu),能夠用更少的能耗更快地完成AI計算任務(wù)。實際對比顯示:性能上,NPU 是 CPU 的 25 倍,是GPU 的 6.25 倍(25/4);能效比上,NPU 更是達到了 CPU 的 50 倍,GPU 的 6.25 倍(50/8)。

實測中,麒麟 970 的 NPU 每分鐘可以識別出 2005 張照片,而在沒有NPU的情況下每分鐘只能識別 97 張,優(yōu)勢對比非常明顯。

麒麟970是史上首個在端側(cè)實現(xiàn)人工智能推理應(yīng)用的手機芯片平臺。筆者在芯片發(fā)布之初就判斷,華為將憑借這個新的計算平臺領(lǐng)先高通的驍龍平臺,并將在人工智能應(yīng)用方面,幫助華為手機與其他手機拉開至少4個月的領(lǐng)先期。事實果真如此,麒麟970開啟了端側(cè)人工智能應(yīng)用的新篇章,并助力華為Mate10手機率先實現(xiàn)了拍照場景識別、翻譯等人工智能應(yīng)用,引領(lǐng)了整個智能手機的AI應(yīng)用大潮。

2018年9月,華為在2018德國柏林消費電子展(IFA)上正式發(fā)布麒麟980處理器。麒麟980在AI方面有了更大的突破:首度采用了雙核NPU,提供147個算子,人工智能算力大幅度提升;每分鐘識別4500張圖片,識別速度相比上一代提升120%,遠高于業(yè)界同期水平。

麒麟980的發(fā)布,標志著華為在端側(cè)人工智能領(lǐng)域的成熟與進步。獨立的雙核NPU處理單元讓麒麟980在人臉識別、物體識別、物體檢測、圖像分割、智能翻譯等AI場景下應(yīng)用更流暢。例如華為Mat 20系列可實現(xiàn)多人姿態(tài)實時識別,實時幀率高達30 FPS,無論是表演節(jié)奏感極強的舞蹈,還是在鏡頭前快速跑步,麒麟980都能夠?qū)崟r繪制出人體的關(guān)節(jié)和線條。可以說,麒麟980再次引領(lǐng)了全球端側(cè)AI應(yīng)用的潮流。

另外,基于獨立的NPU處理單元,華為從麒麟970開始就推出了HUAWEI HiAI。HiAI是面向移動終端的AI能力開放平臺,是專門為了配合NPU進行開發(fā)的第三方開發(fā)者平臺,能夠給開發(fā)者提供AI計算庫以及API,并且能夠便捷地編寫APP上的AI應(yīng)用。

HUAWEI HiAI能力開放平臺分為三層架構(gòu),除了我們熟知的HUAWEI HiAI Foundation的運算能力、HUAWEI HiAI Engine端側(cè)應(yīng)用能力,還有海量的HUAWEI HiAI service服務(wù)能力。此外,HiAI能夠讓開發(fā)者快速遷移模型,并且對于普通APP開發(fā)者來說,HiAI會提供已封裝好的語音識別等技術(shù),開發(fā)者能夠直接應(yīng)用。

HUAWEI HiAI堪稱是一個開發(fā)人工智能APP的神器,能幫助小白用戶迅速開發(fā)出AI應(yīng)用,而且能用上麒麟芯片的NPU能力。開發(fā)者可以利用這個開放架構(gòu)開發(fā)新的人工智能應(yīng)用,并通過華為認證后集成進麒麟平臺。這是超越APP應(yīng)用的新機制,開放的架構(gòu)讓華為率先擁有了大量編外人工智能開發(fā)者,這也意味著麒麟平臺可以集成大量第三方的人工智能算法和應(yīng)用。

如今,專用NPU在人工智能領(lǐng)域的應(yīng)用已成燎原之勢。筆者觀察到,業(yè)界其他芯片廠商也在采用這樣的獨立NPU架構(gòu),例如蘋果A12、聯(lián)發(fā)科的P系列平臺等。在安防領(lǐng)域,獨立NPU已經(jīng)推動智能安防發(fā)展,一些IP公司也開發(fā)出了專用NPU IP如Imagination的PowerVR 2NX NNA加速器、PowerVR 3NX NNA等。反之,某些沒有集成獨立NPU的芯片平臺,依舊在通過CPUGPU和DSP進行人工智能運算,不但增加了功耗,影響其他運算任務(wù)的處理,還加大了第三方人工智能算法和應(yīng)用接入的難度。

目前,人工智能已成人類的一項通用技術(shù)。人類會用AI技術(shù)和理念去解決現(xiàn)在和未來的問題, AI也必將會與更多產(chǎn)業(yè)應(yīng)用結(jié)合,從而改變所有行業(yè),更將改變每個組織。人工智能在語音識別、圖像識別、工業(yè)、汽車自動駕駛、農(nóng)業(yè)、AR、VR等領(lǐng)域的應(yīng)用潛力無限,而華為麒麟系列芯片在端側(cè)人工智能領(lǐng)域的探索處于全球領(lǐng)先,華為手機卓越的人工智能應(yīng)用體驗也應(yīng)證了專用NPU架構(gòu)的選擇是非常明智和正確的,期待華為在這個領(lǐng)域的探索更深入,帶給我們更多驚喜。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • MOSFET
    +關(guān)注

    關(guān)注

    151

    文章

    10850

    瀏覽量

    235193
  • 人工智能
    +關(guān)注

    關(guān)注

    1821

    文章

    50403

    瀏覽量

    267289
  • NPU
    NPU
    +關(guān)注

    關(guān)注

    2

    文章

    388

    瀏覽量

    21393

原文標題:發(fā)揮端側(cè)人工智能潛力,專用NPU才是王道

文章出處:【微信號:FPGA-EETrend,微信公眾號:FPGA開發(fā)圈】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    Arm與Google攜手共筑側(cè)AI未來

    如今,全球數(shù)十億智能手機用戶已將實時輔助、流暢溝通與高度個性化視為基礎(chǔ)體驗。在智能手機的功耗限制下實現(xiàn)高性能側(cè)人工智能 (AI),對規(guī)?;?/div>
    的頭像 發(fā)表于 04-21 14:39 ?383次閱讀

    嵌入式人工智能課程(華清遠見)

    嵌入式 AI 編譯器優(yōu)化:華清遠見課程,解鎖極致側(cè)性能 隨著人工智能從云端全面向邊緣側(cè)和終端側(cè)下沉,“萬物智聯(lián)”的時代已經(jīng)悄然到來。然而
    發(fā)表于 04-16 18:47

    軟通動力基于OpenClaw開源框架深度自研側(cè)智能體平臺

    隨著人工智能加速從云端下沉至終端、從被動交互邁向主動執(zhí)行,側(cè)智能體正成為定義智能硬件體驗的核心引擎。軟通動力基于OpenClaw開源框架深
    的頭像 發(fā)表于 02-27 11:48 ?930次閱讀

    【新品發(fā)布】艾為重磅發(fā)布側(cè)AI高性能NPU語音芯片,打造智能語音體驗新標桿

    數(shù)模龍頭艾為電子全新推出高性能NPU神經(jīng)網(wǎng)絡(luò)智能語音處理芯片:AWA89601,集成音頻專用NPU(神經(jīng)網(wǎng)絡(luò)處理器),通過聲音模型訓(xùn)練與NPU
    的頭像 發(fā)表于 01-07 18:33 ?596次閱讀
    【新品發(fā)布】艾為重磅發(fā)布<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI高性能<b class='flag-5'>NPU</b>語音芯片,打造<b class='flag-5'>智能</b>語音體驗新標桿

    安謀科技:側(cè)NPU技術(shù)創(chuàng)新,拉動AI算力落地引擎

    X3 NPU IP以及生態(tài)建設(shè)、NPU發(fā)展趨勢等話題。 ? 圖:安謀科技產(chǎn)品總監(jiān)鮑敏祺 ? 周易X3 NPU IP正當時 ? 安謀科技周易X3 NPU IP面向
    的頭像 發(fā)表于 12-09 16:44 ?6169次閱讀
    安謀科技:<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>NPU</b>技術(shù)創(chuàng)新,拉動AI算力落地引擎

    AI體驗躍遷,天璣9500用雙NPU開創(chuàng)側(cè)AI新時代

    AI 正從“嘗鮮”邁向“常用”,下一代體驗該由誰定義?聯(lián)發(fā)科天璣9500給出答案:行業(yè)首發(fā)將側(cè) AI 4K 文生圖帶到手機,引領(lǐng)移動影像與創(chuàng)造力的范式躍遷。 全新“超性能 + 超能效”雙 NPU
    的頭像 發(fā)表于 09-24 14:47 ?923次閱讀
    AI體驗躍遷,天璣9500用雙<b class='flag-5'>NPU</b>開創(chuàng)<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI新時代

    航天宏圖人工智能技術(shù)深度賦能社會治理現(xiàn)代化

    航天宏圖多年來持續(xù)重點投入技術(shù)研發(fā),尤其專注人工智能深度探索。航天宏圖多以自主研發(fā)“天權(quán)大模型” 是一款基于多模態(tài)大模型技術(shù)的遙感解譯專用AI大模型,它以人工智能為底座,提供遙感影像智能
    的頭像 發(fā)表于 09-06 10:35 ?1364次閱讀
    航天宏圖<b class='flag-5'>人工智能</b>技術(shù)深度賦能社會治理現(xiàn)代化

    側(cè)AI推理賦能效率革命,美格智能多領(lǐng)域落地打造行業(yè)范本

    產(chǎn)業(yè)進階:側(cè)AI推理助手成為應(yīng)用剛需作為人工智能技術(shù)最普遍的產(chǎn)品形式之一,“AI助手”已成為各類軟件、終端的重要組成部分,成為AIAgent的主要外在呈現(xiàn)和功能入口。隨著
    的頭像 發(fā)表于 08-25 17:06 ?4210次閱讀
    <b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>AI推理賦能效率革命,美格<b class='flag-5'>智能</b>多領(lǐng)域落地打造行業(yè)范本

    中科創(chuàng)達旗下創(chuàng)通聯(lián)達即將舉辦RUBIK Pi 3側(cè)人工智能技術(shù)巡演

    人工智能技術(shù)加速向側(cè)滲透,驅(qū)動產(chǎn)業(yè)智能化轉(zhuǎn)型的戰(zhàn)略機遇期,全球領(lǐng)先的智能物聯(lián)網(wǎng)產(chǎn)品和解決方案提供商Thundercomm(創(chuàng)通聯(lián)達)將于
    的頭像 發(fā)表于 08-15 15:56 ?1446次閱讀

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    家人們,最近在研究人工智能相關(guān)設(shè)備,挖到了一款超厲害的寶藏——比鄰星人工智能綜合實驗箱,必須來給大伙分享分享!可?(壹捌伍 柒零零玖 壹壹捌陸) 一、開箱即學,便捷拉滿 這個實驗箱真的是為使用者
    發(fā)表于 08-07 14:23

    最新人工智能硬件培訓(xùn)AI 基礎(chǔ)入門學習課程參考2025版(大模型篇)

    人工智能大模型重塑教育與社會發(fā)展的當下,無論是探索未來職業(yè)方向,還是更新技術(shù)儲備,掌握大模型知識都已成為新時代的必修課。從職場上輔助工作的智能助手,到課堂用于學術(shù)研究的智能工具,大模型正在工作生活
    發(fā)表于 07-04 11:10

    谷東智能亮相2025深圳國際人工智能展覽會

    近日,以 “智聯(lián)萬物·啟未來” 為主題的 2025 全球人工智能終端展暨第六屆深圳國際人工智能展盛大開幕。這場人工智能領(lǐng)域的盛會匯聚了眾多國內(nèi)外領(lǐng)軍企業(yè),展示了
    的頭像 發(fā)表于 05-26 17:11 ?2553次閱讀

    德賽西威側(cè)大模型重塑智能座艙體驗

    智能汽車產(chǎn)業(yè)發(fā)展正從規(guī)模擴張向質(zhì)量躍升轉(zhuǎn)變,其中大模型驅(qū)動的智能化升級將成為產(chǎn)業(yè)突破的核心引擎。在日前召開的2025上海車展國際汽車關(guān)鍵技術(shù)論壇上,德賽西威技術(shù)中心人工智能實驗室專家張書赫博士以《
    的頭像 發(fā)表于 05-15 09:13 ?1948次閱讀

    華邦電子創(chuàng)新存儲賦能側(cè)智能側(cè)

    人工智能技術(shù)的飛速發(fā)展,#側(cè)AI 正在成為智能設(shè)備發(fā)展的重要趨勢。華邦電子正憑借其卓越存儲技術(shù)和豐富的產(chǎn)品,積極布局端側(cè) AI 市場,為
    的頭像 發(fā)表于 05-14 09:59 ?1841次閱讀
    華邦電子創(chuàng)新存儲賦能<b class='flag-5'>端</b><b class='flag-5'>側(cè)</b><b class='flag-5'>智能</b><b class='flag-5'>端</b><b class='flag-5'>側(cè)</b>
    商丘市| 会东县| 萨迦县| 镇远县| 孟津县| 孟州市| 太仓市| 彝良县| 鸡泽县| 望都县| 赤壁市| 会理县| 沁水县| 苏尼特左旗| 凤山县| 锡林浩特市| 四川省| 富锦市| 德阳市| 托克逊县| 宣化县| 中山市| 涿鹿县| 南陵县| 内丘县| 五华县| 右玉县| 渑池县| 石狮市| 哈密市| 西充县| 巨野县| 嘉兴市| 巴塘县| 东海县| 阜阳市| 伊通| 五家渠市| 阿巴嘎旗| 长顺县| 新民市|