日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

DPU特征結(jié)構(gòu)系列(一)DPU是以數(shù)據(jù)為中心IO密集的專用處理器

中科馭數(shù)(北京)科技有限公司 ? 2022-04-27 14:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從應(yīng)用特征來(lái)看,可以把應(yīng)用分為“IO密集型”和“計(jì)算密集型”兩類,如下圖所示。IO密集型應(yīng)用,通常體現(xiàn)為較高的輸入和輸出帶寬,數(shù)據(jù)直接來(lái)自于IO,數(shù)據(jù)通常具備流式特征,數(shù)據(jù)局部性不顯著,如果處理性能與帶寬匹配,片上緩存的作用就可以弱化。例如處理路由轉(zhuǎn)發(fā)、數(shù)據(jù)加密、壓縮等。計(jì)算密集型應(yīng)用,體現(xiàn)為較高的計(jì)算密度,通常浮點(diǎn)性能突出,數(shù)據(jù)來(lái)自主存,數(shù)據(jù)局部性顯著,復(fù)用性高,主存的大小對(duì)于問(wèn)題求解的性能有直接影響。例如求解線性代數(shù)方程組,大規(guī)模神經(jīng)網(wǎng)絡(luò)訓(xùn)練、推理等。

pYYBAGJo3EOAddbKAAhA9nkSZ-c278.png

圖不同類型的處理器的特征結(jié)構(gòu)

一個(gè)處理器芯片是“IO密集”還是“計(jì)算密集”只部分決定了芯片的結(jié)構(gòu)特征,并不能完全定義芯片的主體架構(gòu)。無(wú)論是IO密集,還是計(jì)算密集,即可以以通用CPU為核心構(gòu)造主體計(jì)算架構(gòu),也可以以專用加速器為核心構(gòu)造主體計(jì)算架構(gòu)。前者可稱之為以控制為中心(control-centric)的模式,后者稱之為以數(shù)據(jù)為中心(data-centric)的模式。控制為中心的核心是實(shí)現(xiàn)“通用”,數(shù)據(jù)為中心的核心是通過(guò)定制化實(shí)現(xiàn)“高性能”。以應(yīng)用特征和架構(gòu)特征這兩個(gè)維度粗略劃分處理器芯片類型分布,如圖2-1所示。

通用CPU是偏向于控制為中心結(jié)構(gòu),理論上看就是要“圖靈完備”,要支持完備的指令集,通過(guò)編程指令序列來(lái)定義計(jì)算任務(wù),通過(guò)執(zhí)行指令序列來(lái)完成計(jì)算任務(wù),因此具備極其靈活的編程支持,可以任意定義計(jì)算的邏輯實(shí)現(xiàn)“通用”——這也是CPU最大的優(yōu)勢(shì)。同時(shí),為了提高編程的開發(fā)效率,降低編譯器復(fù)雜度,緩存管理和細(xì)粒度并行度的開發(fā)通常都是由硬件來(lái)完成。類似的,還有大量的用于各種嵌入式、移動(dòng)設(shè)備的微控制器MCU,并不強(qiáng)調(diào)高帶寬,也是以控制為中心的結(jié)構(gòu)。NP,DSP也是便向于基于通用處理器來(lái)做專用化擴(kuò)展,但是非常注重高通量的性能屬性。例如,NP要支持?jǐn)?shù)Tbps的轉(zhuǎn)發(fā)帶寬,所以大體可以視為控制為中心、但是IO密集的處理器類型。

GPU是以數(shù)據(jù)為中心的結(jié)構(gòu),形式上更傾向于專用加速器。GPU的結(jié)構(gòu)稱之為數(shù)據(jù)并行(data-parallel)結(jié)構(gòu),優(yōu)化指令并行度并不是提升性能的重點(diǎn),通過(guò)大規(guī)模同構(gòu)核進(jìn)行細(xì)粒度并行來(lái)消化大的數(shù)據(jù)帶寬才是重點(diǎn)。例如,最新的NVIDIA TITAN RTX GPU有4608個(gè)CUDA核、576個(gè)Tensor核,而且單片GPU通常配置數(shù)十GB的超大顯存。同時(shí)緩存管理多采用軟件顯示管理,降低硬件復(fù)雜度。這類超眾核結(jié)構(gòu)是以數(shù)據(jù)為中心、執(zhí)行計(jì)算密集型任務(wù)的代表性架構(gòu)。

DPU也偏向于數(shù)據(jù)為中心的結(jié)構(gòu),形式上集成了更多類別的專用加速器,犧牲一定的指令靈活性以獲得更極致的性能。但是與GPU不同,DPU要應(yīng)對(duì)更多的網(wǎng)絡(luò)IO,既包括外部以太網(wǎng),也包括內(nèi)部虛擬IO,所以DPU所面臨的數(shù)據(jù)并行更多可能是數(shù)據(jù)包并行,而不是圖像中的像素、像塊級(jí)并行。而且DPU也會(huì)配置少數(shù)通用核(如ARM,MIPS)來(lái)處理一定的控制面的任務(wù),運(yùn)行輕量級(jí)操作系統(tǒng)來(lái)管理DPU上的眾多的異構(gòu)核資源,所以體現(xiàn)了一定“通用”性,但性能優(yōu)勢(shì)主要不源于這些通用核,而是大量專用計(jì)算核。早期的一些網(wǎng)絡(luò)處理器采用過(guò)類似Tile64的通用眾核結(jié)構(gòu),以增加核的數(shù)量來(lái)應(yīng)對(duì)多路處理的數(shù)據(jù),實(shí)現(xiàn)并發(fā)處理,但單路延遲性能通常都比較差。因此,DPU更偏向于以數(shù)據(jù)為中心,執(zhí)行IO密集任務(wù)。

DPU是軟件定義的技術(shù)路線下的重要產(chǎn)物。在軟件定義網(wǎng)絡(luò)中,將數(shù)據(jù)面與控制面分離是最核心的思想。DPU被定義為強(qiáng)化了數(shù)據(jù)面性能的專用處理器,配合控制面的CPU,可以實(shí)現(xiàn)性能與通用性的更佳的平衡。

來(lái)源:專用數(shù)據(jù)處理器(DPU)技術(shù)白皮書,中國(guó)科學(xué)院計(jì)算技術(shù)研究所,鄢貴海等

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • DPU
    DPU
    +關(guān)注

    關(guān)注

    0

    文章

    418

    瀏覽量

    27150
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    BK7259 具備邊緣AI能力的高級(jí)音視頻Wi-Fi +藍(lán)牙SOC芯片/規(guī)格書/原理圖

    協(xié)議。該方案專為需要豐富資源和低功耗的應(yīng)用而設(shè)計(jì)。 無(wú)線處理器+應(yīng)用處理器(內(nèi)置Arm@EthosTM- U65) 二.BK7259配備個(gè)無(wú)線處理器
    發(fā)表于 04-28 09:53

    深入剖析STA2065:高性能信息娛樂(lè)應(yīng)用處理器

    深入剖析STA2065:高性能信息娛樂(lè)應(yīng)用處理器 在電子設(shè)備飛速發(fā)展的今天,款優(yōu)秀的應(yīng)用處理器對(duì)于實(shí)現(xiàn)各種復(fù)雜功能起著至關(guān)重要的作用。今天,我們就來(lái)深入了解下意法半導(dǎo)體(ST)推出
    的頭像 發(fā)表于 04-16 14:05 ?139次閱讀

    STA2064:高度集成的信息娛樂(lè)應(yīng)用處理器

    與高性能嵌入式GPS,車輛主機(jī)、移動(dòng)導(dǎo)航、遠(yuǎn)程信息處理、信息娛樂(lè)、高級(jí)音頻和連接系統(tǒng)等應(yīng)用提供了強(qiáng)大的支持。下面我們就來(lái)詳細(xì)了解下這款處理器。 文件下載: STA2064N.pdf
    的頭像 發(fā)表于 04-16 14:05 ?165次閱讀

    恩智浦全新i.MX 93W應(yīng)用處理器重磅發(fā)布

    恩智浦半導(dǎo)體宣布推出i.MX 93W應(yīng)用處理器,進(jìn)步擴(kuò)展其i.MX 93產(chǎn)品系列。這款i.MX 93W片上系統(tǒng)(SoC)專為加速物理AI的部署而設(shè)計(jì),是首款將專用AI神經(jīng)
    的頭像 發(fā)表于 03-16 09:45 ?2509次閱讀

    支持藍(lán)牙Piconet和Scatternet組網(wǎng)協(xié)議的高性能32位藍(lán)牙音頻應(yīng)用處理器-BP1048B2

    32位藍(lán)牙音頻應(yīng)用處理器種集成了?32位RISC內(nèi)核、DSP指令集、浮點(diǎn)運(yùn)算單元(FPU)以及藍(lán)牙通信功能?的專用芯片,專為處理高質(zhì)量音頻流而設(shè)計(jì)。
    的頭像 發(fā)表于 03-11 16:43 ?341次閱讀
    支持藍(lán)牙Piconet和Scatternet組網(wǎng)協(xié)議的高性能32位藍(lán)牙音頻應(yīng)<b class='flag-5'>用處理器</b>-BP1048B2

    DPU數(shù)據(jù)處理器的核心功能和應(yīng)用領(lǐng)域

    DPU,全稱數(shù)據(jù)處理器(Data Processing Unit),是種專門用于處理數(shù)據(jù)中心數(shù)據(jù)
    的頭像 發(fā)表于 02-02 13:52 ?963次閱讀
    <b class='flag-5'>DPU</b><b class='flag-5'>數(shù)據(jù)處理器</b>的核心功能和應(yīng)用領(lǐng)域

    基于DPU的智能盤框方案,華為如何大幅提升AI推理的效率?

    DPU
    腦極體
    發(fā)布于 :2026年01月20日 12:53:10

    探索NXP i.MX 93應(yīng)用處理器家族:高效邊緣計(jì)算的理想之選

    和豐富的功能,邊緣計(jì)算應(yīng)用提供了強(qiáng)大的支持。本文將深入介紹i.MX 93應(yīng)用處理器家族的特點(diǎn)和優(yōu)勢(shì),電子工程師們?cè)谠O(shè)計(jì)相關(guān)產(chǎn)品時(shí)提供有價(jià)值的參考。 文件下載: NXP Semiconductors i.MX 93節(jié)能應(yīng)
    的頭像 發(fā)表于 12-24 14:50 ?876次閱讀

    探索i.MX 91應(yīng)用處理器家族:邊緣應(yīng)用帶來(lái)新可能

    開發(fā)者提供了個(gè)強(qiáng)大而靈活的平臺(tái)。今天,我們就來(lái)深入了解下i.MX 91應(yīng)用處理器家族的特點(diǎn)和優(yōu)勢(shì)。 文件下載: NXP Semiconductors i.MX 91應(yīng)用處理器.pd
    的頭像 發(fā)表于 12-24 11:50 ?1376次閱讀

    NVIDIA推出全新BlueField-4 DPU

    全新 NVIDIA BlueField DPU 具有 800Gb/s 的吞吐量,其集成的 NVIDIA ConnectX-9 SuperNIC 和 NVIDIA DOCA 微服務(wù) AI 數(shù)據(jù)存儲(chǔ)、網(wǎng)絡(luò)和安全帶來(lái)突破性的加速。
    的頭像 發(fā)表于 11-03 14:48 ?1237次閱讀

    恩智浦推出i.MX 952人工智能應(yīng)用處理器

    恩智浦半導(dǎo)體宣布推出i.MX 9系列的新成員——i.MX 952應(yīng)用處理器。該處理器專為AI視覺、人機(jī)接口(HMI)及座艙感知應(yīng)用而設(shè)計(jì),通過(guò)集成eIQ Neutron神經(jīng)處理單元(N
    的頭像 發(fā)表于 10-27 09:15 ?3753次閱讀

    RISC-V DPU,重塑數(shù)據(jù)中心算力格局?

    電子發(fā)燒友網(wǎng)綜合報(bào)道 在現(xiàn)代數(shù)據(jù)中心架構(gòu)中,數(shù)據(jù)處理單元(DPU)正迅速崛起繼 CPU 和 GPU 之后的第三顆核心芯片。DPU 專為
    的頭像 發(fā)表于 09-13 00:51 ?5098次閱讀

    第三屆NVIDIA DPU黑客松開啟報(bào)名

    第三屆 NVIDIA DPU 中國(guó)虛擬黑客松(Hackathon)將于 6 月 28 日 - 6 月 30 日正式開啟!作為備受廣大開發(fā)者期待的年度賽事,它將提供與 NVIDIA 加速網(wǎng)絡(luò)技術(shù)深度
    的頭像 發(fā)表于 05-27 10:16 ?1036次閱讀

    中科馭數(shù)攜DPU全棧產(chǎn)品亮相福州數(shù)博會(huì),賦能智算時(shí)代算力基建

    會(huì)”)也拉開帷幕。共有150多家企業(yè)參展,展會(huì)吸引了八萬(wàn)多名觀眾參觀。作為國(guó)內(nèi)DPU領(lǐng)域領(lǐng)軍企業(yè),中科馭數(shù)攜三大產(chǎn)品線亮相展會(huì),其創(chuàng)新的DPU技術(shù)方案成為專業(yè)觀眾關(guān)注焦點(diǎn)。據(jù)大會(huì)報(bào)告的數(shù)據(jù)顯示,我國(guó)算力總規(guī)模已達(dá)280EFLOP
    的頭像 發(fā)表于 05-23 11:01 ?773次閱讀
    中科馭數(shù)攜<b class='flag-5'>DPU</b>全棧產(chǎn)品亮相福州數(shù)博會(huì),賦能智算時(shí)代算力基建

    DPU02高性能、低延遲、全場(chǎng)景化的數(shù)據(jù)處理用智能駕駛等

    、核心參數(shù)亮點(diǎn) DPU02(Data Processing Unit 02)是專為邊緣計(jì)算與實(shí)時(shí)數(shù)據(jù)處理設(shè)計(jì)的下代硬件加速單元,其關(guān)鍵參數(shù)優(yōu)勢(shì)包括: ? 超低延遲:
    的頭像 發(fā)表于 05-08 14:14 ?729次閱讀
    涟源市| 三台县| 宣城市| 九江县| 平湖市| 德钦县| 南和县| 剑川县| 正宁县| 苗栗市| 基隆市| 沿河| 清远市| 苏尼特右旗| 平陆县| 广安市| 化隆| 商都县| 上思县| 苏州市| 巴里| 河间市| 铜鼓县| 门源| 嘉义县| 河西区| 孟村| 嘉义市| 天峻县| 桐乡市| 西城区| 南开区| 武胜县| 汪清县| 龙州县| 自治县| 黔西县| 恩平市| 威海市| 大同县| 洞口县|