日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

為什么Chimera GPNPU如此充滿想象力和令人眼花繚亂呢

SSDFans ? 來源:SSDFans ? 2023-01-08 15:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

希臘神話中,Chimera是一種巨大的噴火混血動物,由不同的動物部位組成;現(xiàn)在它被用來描述任何想象力豐富、難以置信或令人眼花繚亂的東西。

筆者最近從Quadric那里接觸到Chimera GPNPU(通用神經處理器),真是“產品”如其名。

Quadric公司成立于2017年,最初計劃基于其新創(chuàng)Chimera GPNPU架構提供推理邊緣芯片 (針對物聯(lián)網(wǎng)“邊緣”推理應用的芯片)。

他們的第一塊芯片被快速驗證,一些早期用戶已經在進行試驗。但最近,Quadric公司決定將Chimera GPNPU授權為IP,向更廣泛的客戶群體展示他們的技術。

下圖是利用Chimera GPNPU實現(xiàn)面部識別和認證的簡化示意圖,我們就以此作為切入點看下為什么Chimera GPNPU如此“充滿想象力”和“令人眼花繚亂”。

954d2626-8def-11ed-bfe3-dac502259ad0.png

假設所有這些功能都在智能相機SoC中實現(xiàn),一個攝像機/傳感器為左邊的第一個功能塊提供視頻流。這個應用很可能會用于未來幾代的門鈴攝像頭中。

觀察兩個粉紅色的“Face Detect”和“Face Authentication”功能塊,它們是通過人工智能/機器學習(AI/ML)推理實現(xiàn)的。

在過去幾年中,這種類型的推理發(fā)展極為迅速,從學術研究到早期部署,現(xiàn)在幾乎成為軟件開發(fā)中的一個必不可少的元素。

將推理(基于視覺、聲音等形式)作為創(chuàng)建應用程序的構建塊之一,這種想法我們可以認為是“軟件2.0”。

但這實現(xiàn)起來并不容易,SoC傳統(tǒng)應對軟件2.0挑戰(zhàn)的方式如下(a)所示。

95576e88-8def-11ed-bfe3-dac502259ad0.png

從(a)圖中可以看到,神經處理器單元(NPU)、矢量數(shù)字信號處理器(DSP)和實時中央處理器(CPU)為三個獨立的核心。

要實現(xiàn)前面的面部識別和認證流程,使用常規(guī)方法,前兩個功能塊(Resize和Channel unpack)相關的處理將在DSP核心上執(zhí)行。

然后,DSP生成的數(shù)據(jù)將被送到NPU核心上運行神經網(wǎng)絡“Face Detect”模型;NPU的輸出再送給CPU核心,CPU將運行一個“NMS”算法來決定使用哪個算法效果最好。

然后,DSP將使用CPU識別的邊界框在圖像上執(zhí)行更多的任務,如“Crop + Gray Scale”和“Resize”。最后,這些數(shù)據(jù)將送到NPU核心上運行“Face Authenticate”模型。

用上述方法實現(xiàn)后,我們可能會發(fā)現(xiàn)沒有達到想要的吞吐率。如何找出性能瓶頸在哪里?另外,三個核心之間交換數(shù)據(jù)產生了多少功耗?

真正的潛在問題是,擁有三個獨立的處理器核心會使整個設計過程變得繁瑣。

例如,硬件設計人員必須決定要為每個核心分配多少內存,以及在功能塊之間需要多大的緩沖區(qū)。同時,軟件開發(fā)人員需要決定如何在內核之間劃分算法。這很痛苦,因為程序員不愿意花大量時間考慮所運行目標平臺的硬件細節(jié)。

另一個問題是ML模型正在迅速發(fā)展,誰都不知道未來幾年會有怎樣的ML模型。

所有這些問題都會導致ML部署無法盡可能快地加速,因為針對這種類型的常規(guī)目標平臺進行開發(fā),對于編程、調試和性能調優(yōu)等方面來說,都是一件非常痛苦的事情。

再回到Chimera GPNPU,它由前面圖(b)部分的粉色區(qū)域表示。

GPNPU將DSP、CPU和NPU的屬性結合在單個核心中,作為一個傳統(tǒng)的CPU/DSP的組合,它可以運行C/ C++代碼,具有完整的32位標量+向量指令集架構(ISA),同時可以用作一個NN圖處理器,運行8位推理優(yōu)化的ML代碼。這種方法通過在同一個引擎上運行兩種類型的代碼,獨特地解決了信號傳輸?shù)奶魬?zhàn)。

我們可以認為Chimera GPNPU是經典的馮·諾依曼RISC機和收縮陣列/2D矩陣架構的混合體。

Chimera GPNPU的一個關鍵優(yōu)勢是它能夠適應不斷發(fā)展和日益復雜的ML網(wǎng)絡?,F(xiàn)在東西變得越來越復雜,需要在NN的體系結構中做更多的條件控制流,可以是CNN, RNN, DNN等等。

傳統(tǒng)的NPU通常是硬連接的加速器,不能條件執(zhí)行。例如有一個專用加速器,用戶不能在第14層的某個地方停下來檢查條件或中間結果,然后分支判斷并做各種面向控制流的事情。

在這些情況下,必須在NPU和CPU之間來回移動數(shù)據(jù),這將對性能和功耗產生沖擊。而使用一個Chimera GPNPU,我們可以在NN和控制代碼之間在時鐘基礎上來回切換。

這里還有很多需要討論,比如Chimera GPNPU在執(zhí)行卷積層(這是CNN的核心)方面的出色表現(xiàn),以及它們的TOPS(每秒萬億次操作)評分,都令筆者非常興奮。這里不再詳細闡述,有需要的讀者可以咨詢Quadric公司。

最后,筆者想快速概述一下Quadric軟件開發(fā)工具包(SDK),如下所示。

95615308-8def-11ed-bfe3-dac502259ad0.png

歸根結底,一切都是由軟件驅動的。使用TensorFlow、PyTorch、Caffe等框架生成的經過訓練的神經網(wǎng)絡圖/模型被送入Apache TVM(一個用于CPU、GPU和ML加速器的開源機器學習編譯器框架),生成一個Relay輸出(Relay是TVM框架的高級中間表示)。

中繼表示的轉換和優(yōu)化由Chimera CGC執(zhí)行,它將轉換和優(yōu)化后的神經網(wǎng)絡輸出為C++代碼。Chimera LLVM C++ Compiler將這些代碼與開發(fā)人員的C++應用程序代碼合并,所有這些輸出為一個可執(zhí)行文件,運行在目標硅/SoC中的Chimera GPNPU上。

注意,Quadric SDK是作為預打包的Docker映像交付的,用戶可以下載并在自己的系統(tǒng)上運行。Quadric很快將把這個SDK托管在Amazon Web Services (AWS)上,從而允許用戶通過他們的Web瀏覽器訪問它。

讓筆者特別感興趣的是,Quadric的工作人員正在開發(fā)一個圖形用戶界面(GUI),它可以讓開發(fā)人員拖放包含CPU/DSP代碼和NPU模型的管道構建塊,將它們拼接在一起,并將所有內容編譯成一個ChimeraGPNPU image。這種無代碼開發(fā)方法將使大量開發(fā)人員能夠創(chuàng)建含有Chimera GPNPU的芯片。






審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • SoC系統(tǒng)

    關注

    0

    文章

    52

    瀏覽量

    11232
  • 機器學習
    +關注

    關注

    67

    文章

    8567

    瀏覽量

    137272
  • 數(shù)字信號處理器

    關注

    5

    文章

    529

    瀏覽量

    28503
  • NPU
    NPU
    +關注

    關注

    2

    文章

    387

    瀏覽量

    21382

原文標題:結合CPU、DSP、NPU功能為一體的新型混合處理器——Chimera GPNPU

文章出處:【微信號:SSDFans,微信公眾號:SSDFans】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    展會直擊:無人機眼花繚亂,芯片卡位低空經濟大爆發(fā)

    展會直擊:無人機眼花繚亂,芯片卡位低空經濟大爆發(fā) ? 電子發(fā)燒友網(wǎng)報道(文/黃晶晶)5月23日第9屆世界無人機大會在深圳會展中心隆重開幕。本屆大會展示低空智能制造、無人機、eVTOL、人工智能機器人
    的頭像 發(fā)表于 05-25 02:35 ?8269次閱讀
    展會直擊:無人機<b class='flag-5'>眼花繚亂</b>,芯片卡位低空經濟大爆發(fā)

    云天勵飛完成DeepSeek-V4系列模型關鍵機制適配驗證

    4月24日,DeepSeek-V4 系列模型發(fā)布。圍繞該模型 CSA/HCA 混合注意機制帶來的新型計算需求,云天勵飛依托自研 GPNPU 架構及 IFWA 智能融合軟件棧,通過 PyTorch 插件 torch_ifwa,完成了面向
    的頭像 發(fā)表于 04-30 17:09 ?5138次閱讀

    SOT23-5不是版本號:解讀封裝命名中的數(shù)字含義

    導語:在采購BOM表或查閱Datasheet時,我們常常見到SOT23-3、SOT23-5、SOT23-6甚至SOT223等令人眼花繚亂的名稱。這些數(shù)字并不是隨機編號,它們背后有一套嚴謹?shù)墓I(yè)標準
    的頭像 發(fā)表于 04-29 10:23 ?176次閱讀
    SOT23-5不是版本號:解讀封裝命名中的數(shù)字含義

    直流變換電源廠家推薦:為什么華南工程師都認“廣州郵科”?

    選直流變換電源廠家,是不是很頭疼?參數(shù)眼花繚亂,品牌多如牛毛。選錯了,設備三天兩頭出毛??;選對了,省心又省錢。今天,咱們就聊聊一家在華南地區(qū),特別是通信和電力行業(yè)里口碑很硬的廠家——廣州郵科。
    的頭像 發(fā)表于 03-25 15:42 ?231次閱讀
    直流變換電源廠家推薦:為什么華南工程師都認“廣州郵科”?

    別再亂買讀寫器了!2026年選購RFID手持機,認準這三個“硬指標”

    芯片選E710 、續(xù)航看11700mAh 、防護認準IP67。本文帶你深度對比基于ImpinjE710芯片UHF超高頻rfid讀寫器的各項一手數(shù)據(jù),教你如何在眼花繚亂的市場中選出性價比之王。
    的頭像 發(fā)表于 03-03 15:19 ?266次閱讀
    別再亂買讀寫器了!2026年選購RFID手持機,認準這三個“硬指標”

    請問在哪里可以找到 VisionFive 2 上的 VPU?

    /building_starfive_debian_image, VPU驅動程序是要建造的。但是,它不應該帶有相應的物理硬件嗎? 在這個VisionFive 2 規(guī)范,沒有任何地方提到VPU,但只有一個JH7110 處理器 + 想象力GPU. 誰能在黑板上突出顯示,在哪里VPU單元?
    發(fā)表于 02-11 08:17

    UPS電源怎么選?5大核心指標,教您一眼看穿性能優(yōu)劣!

    關鍵業(yè)務連續(xù)性的“生命線”。然而,市場上UPS品牌型號繁多,參數(shù)令人眼花繚亂。如何穿透營銷話術,準確判斷一臺UPS電源的性能優(yōu)劣?作為專業(yè)的電源解決方案提供商,優(yōu)比
    的頭像 發(fā)表于 01-13 09:56 ?350次閱讀
    UPS電源怎么選?5大核心指標,教您一眼看穿性能優(yōu)劣!

    廣州郵科逆變電源:解決工程人最頭疼的5大用電難題

    在工地摸爬滾打的工程師們都懂,電源設備選不好,輕則設備罷工,重則全線停工。面對市場上眼花繚亂的產品,廣州郵科逆變電源到底有什么獨到之處,能解決哪些實際痛點?今天咱們就聊聊這個實在話題。
    的頭像 發(fā)表于 01-06 09:56 ?251次閱讀
    廣州郵科逆變電源:解決工程人最頭疼的5大用電難題

    選可調電源別再盲從!品牌推薦依據(jù)有哪些?廣州郵科符合標準嗎?

    搞研發(fā)、做維修、玩電子的朋友,是不是經常為選一臺靠譜的可調電源頭疼?市面上品牌這么多,參數(shù)看得眼花繚亂,到底可調電源品牌推薦依據(jù)有哪些?今天咱就拋開廣告,聊聊那些老師傅們真正看重的選擇標準。
    的頭像 發(fā)表于 12-30 09:45 ?318次閱讀
    選可調電源別再盲從!品牌推薦依據(jù)有哪些?廣州郵科符合標準嗎?

    積木+3D堆疊!GPNPU架構創(chuàng)新,應對AI推理需求

    落地的關鍵瓶頸。在此背景下,云天勵飛推出其第五代芯片架構——GPNPU(General-Purpose Neural Processing Unit,通用神經網(wǎng)絡處理單元),以一場底層架構的革命,試圖重塑AI算格局,推動大模型推理走向極致性價比時代。 ?
    的頭像 發(fā)表于 12-11 08:57 ?8138次閱讀

    湘軍,讓算變成生產?

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    廣州唯創(chuàng)電子WT588F(C013)語音芯片:賦能智能玩具的“聲”動未來

    開啟充滿想象力的聲音世界。一、核心優(yōu)勢:強大功能,奠定互動基石WT588F(C013)芯片專為智能玩具的語音需求深度優(yōu)化,集多項核心功能于一身:高保真語音播放:支持
    的頭像 發(fā)表于 08-08 08:09 ?861次閱讀
    廣州唯創(chuàng)電子WT588F(C013)語音芯片:賦能智能玩具的“聲”動未來

    Samtec技術漫談 | 開放式Pin針區(qū)域的多功能應用邏輯

    摘要前言 世界上有著各種各樣的連接器,其中的大多數(shù),很多人可能從未見過。它們存在于手機、電腦、洗衣機和汽車等設備中。 這些連接器的功能和設計種類多得令人眼花繚亂。這讓工程師感到困惑,也讓那些負責購買
    的頭像 發(fā)表于 07-23 17:36 ?2094次閱讀
    Samtec技術漫談 | 開放式Pin針區(qū)域的多功能應用邏輯

    Momenta MNP記憶領航輔助駕駛系統(tǒng)輕松應對城市復雜路況

    城市通勤是無數(shù)司機每天的“必修課”。路口眼花繚亂的紅綠燈、隨處可見的臨時停車、突然闖入視野的行人或車輛,以及夜晚有限的視線和各種意外狀況……這些日常駕駛中的瑣碎現(xiàn)象,總在不經意間消耗著駕駛者的精力。
    的頭像 發(fā)表于 07-07 16:33 ?5244次閱讀

    人工智能重塑電子產業(yè)鏈未來

    AI大模型下半場,應用端的想象力爆炸,有望真正改變一個時代的用戶行為的“殺手級應用”初現(xiàn)江湖。
    的頭像 發(fā)表于 06-23 11:37 ?1268次閱讀
    陆丰市| 邯郸县| 廉江市| 巴彦淖尔市| 桑日县| 格尔木市| 西林县| 中山市| 朝阳区| 常山县| 平江县| 蕲春县| 张家界市| 德江县| 交口县| 平潭县| 延吉市| 台山市| 巫山县| 罗江县| 平原县| 千阳县| 大方县| 嘉荫县| 安国市| 花莲县| 京山县| 临夏市| 莱西市| 噶尔县| 常州市| 富平县| 厦门市| 西充县| 新龙县| 谢通门县| 桂东县| 刚察县| 神农架林区| 庆元县| 丽江市|