日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CPU和GPU大不相同,究竟原因在哪?

5RJg_mcuworld ? 來源:互聯(lián)網(wǎng) ? 作者:佚名 ? 2017-10-26 06:42 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在北京舉辦的NVIDIA GTC China會議中,無論是AI智能運算,還是服務(wù)器數(shù)據(jù)中心、智能城市,甚至還有去年很火熱但是已經(jīng)很多人已經(jīng)支撐不下去的虛擬現(xiàn)實,看起來在很多內(nèi)心中依然是屬于圖形行業(yè)代表的NVIDIA已經(jīng)變得越來越豐滿,不過在這些新聞的背后,似乎還有更大膽的預(yù)言:摩爾定律已死,GPU最終會取代CPU。

摩爾定律是由英特爾Intel)創(chuàng)始人之一戈登·摩爾(Gordon Moore)提出來的。其內(nèi)容為:當價格不變時,集成電路上可容納的元器件的數(shù)目,約每隔18-24個月便會增加一倍,性能也將提升一倍。換言之,每一美元所能買到的電腦性能,將每隔18-24個月翻一倍以上。這一定律揭示了信息技術(shù)進步的速度。

概要:CPU和GPU之所以大不相同,是由于其設(shè)計目標的不同,它們分別針對了兩種不同的應(yīng)用場景。

盡管這種趨勢已經(jīng)持續(xù)了超過半個世紀,摩爾定律仍應(yīng)該被認為是觀測或推測,而不是一個物理或自然法。然而,2010年國際半導(dǎo)體技術(shù)發(fā)展路線圖的更新增長已經(jīng)放緩在2013年年底,之后的時間里晶體管數(shù)量密度預(yù)計只會每三年翻一番。

CPU和GPU之所以大不相同,是由于其設(shè)計目標的不同,它們分別針對了兩種不同的應(yīng)用場景。CPU需要很強的通用性來處理各種不同的數(shù)據(jù)類型,同時又要邏輯判斷又會引入大量的分支跳轉(zhuǎn)和中斷的處理。這些都使得CPU的內(nèi)部結(jié)構(gòu)異常復(fù)雜。而GPU面對的則是類型高度統(tǒng)一的、相互無依賴的大規(guī)模數(shù)據(jù)和不需要被打斷的純凈的計算環(huán)境。于是CPU和GPU就呈現(xiàn)出非常不同的架構(gòu)。

GPU采用了數(shù)量眾多的計算單元和超長的流水線,但只有非常簡單的控制邏輯并省去了Cache。而CPU不僅被Cache占據(jù)了大量空間,而且還有有復(fù)雜的控制邏輯和諸多優(yōu)化電路,相比之下計算能力只是CPU很小的一部分

從上圖可以看出:Cache, local memory: CPU > GPU Threads(線程數(shù)): GPU > CPURegisters: GPU > CPU 多寄存器可以支持非常多的Thread,Thread需要用到register,Thread數(shù)目大,register也必須得跟著很大才行。SIMD Unit(單指令多數(shù)據(jù)流,以同步方式,在同一時間內(nèi)執(zhí)行同一條指令): GPU > CPU。 CPU 基于低延時的設(shè)計:

CPU有強大的ALU(算術(shù)運算單元),它可以在很少的時鐘周期內(nèi)完成算術(shù)計算。當今的CPU可以達到64bit 雙精度。執(zhí)行雙精度浮點源算的加法和乘法只需要1~3個時鐘周期。CPU的時鐘周期的頻率是非常高的,達到1.532~3gigahertz(千兆HZ, 10的9次方),大的緩存也可以降低延時。保存很多的數(shù)據(jù)放在緩存里面,當需要訪問的這些數(shù)據(jù),只要在之前訪問過的,如今直接在緩存里面取即可。復(fù)雜的邏輯控制單元。當程序含有多個分支的時候,它通過提供分支預(yù)測的能力來降低延時。數(shù)據(jù)轉(zhuǎn)發(fā)。 當一些指令依賴前面的指令結(jié)果時,數(shù)據(jù)轉(zhuǎn)發(fā)的邏輯控制單元決定這些指令在pipeline中的位置并且盡可能快的轉(zhuǎn)發(fā)一個指令的結(jié)果給后續(xù)的指令。這些動作需要很多的對比電路單元和轉(zhuǎn)發(fā)電路單元。

GPU是基于大的吞吐量設(shè)計。GPU的特點是有很多的ALU和很少的Cache,緩存的目的是保存后面需要訪問的數(shù)據(jù)的,這點和CPU不同,而是為Thread提高服務(wù)的。如果有很多線程需要訪問同一個相同的數(shù)據(jù),緩存會合并這些訪問,然后再去訪問dram(因為需要訪問的數(shù)據(jù)保存在dram中而不是Cache里面),獲取數(shù)據(jù)后Cache會轉(zhuǎn)發(fā)這個數(shù)據(jù)給對應(yīng)的線程,這個時候是數(shù)據(jù)轉(zhuǎn)發(fā)的角色。但是由于需要訪問dram,自然會帶來延時的問題。GPU的控制單元(左邊黃色區(qū)域塊)可以把多個的訪問合并成少的訪問。

GPU雖然有dram延時,卻有非常多的ALU和非常多的Thread,為了平衡內(nèi)存延時的問題,我們可以中充分利用多的ALU的特性達到一個非常大的吞吐量的效果。盡可能多的分配Threads。通常來看GPU ALU會有非常重的pipeline就是因為這樣。所以CPU擅長邏輯控制,串行的運算。和通用類型數(shù)據(jù)運算不同,GPU擅長的是大規(guī)模并發(fā)計算,這也正是密碼破解等所需要的。所以GPU除了圖像處理,也越來越多的參與到計算當中來。

什么類型的程序適合在GPU上運行?

(1)計算密集型的程序。所謂計算密集型(Compute-intensive)的程序,就是其大部分運行時間花在了寄存器運算上,寄存器的速度和處理器的速度相當,從寄存器讀寫數(shù)據(jù)幾乎沒有延時。可以做一下對比,讀內(nèi)存的延遲大概是幾百個時鐘周期;讀硬盤的速度就不說了,即便是SSD, 也實在是太慢了。

(2)易于并行的程序。GPU其實是一種SIMD(Single Instruction Multiple Data)架構(gòu), 他有成百上千個核,每一個核在同一時間最好能做同樣的事情。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    225991
  • 摩爾定律
    +關(guān)注

    關(guān)注

    4

    文章

    640

    瀏覽量

    81163
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5283

    瀏覽量

    136101

原文標題:GPU會取代CPU的位置嗎?

文章出處:【微信號:mcuworld,微信公眾號:嵌入式資訊精選】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于openEuler平臺的CPU、GPU與FPGA異構(gòu)加速實戰(zhàn)

    隨著 AI、視頻處理、加密和高性能計算需求的增長,單一 CPU 已無法滿足低延遲、高吞吐量的計算需求。openEuler 作為面向企業(yè)和云端的開源操作系統(tǒng),在 多樣算力支持 方面表現(xiàn)出色,能夠高效調(diào)度 CPU、GPU、FPGA
    的頭像 發(fā)表于 04-08 11:02 ?913次閱讀
    基于openEuler平臺的<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>與FPGA異構(gòu)加速實戰(zhàn)

    LoRa、LoRaWAN、NB-IoT、4G DTU 有什么區(qū)別? 工業(yè)無線方案選型分析

    作為一個工程師,當面對 LoRa、LoRaWAN、NB-IoT、4G DTU 等多種無線技術(shù)方案時,工程師往往容易產(chǎn)生選型困惑。它們都具備無線通信能力,但典型應(yīng)用場景并不相同。那么究竟應(yīng)如何選擇?本文將系統(tǒng)梳理各類技術(shù)差異,并提供結(jié)構(gòu)化選型參考與決策表。
    的頭像 發(fā)表于 03-09 17:33 ?793次閱讀
    LoRa、LoRaWAN、NB-IoT、4G DTU 有什么區(qū)別? 工業(yè)無線方案選型分析

    Keysight E4991B 與 E4990A 阻抗分析儀:深入技術(shù)對比與選型指南

    的高性能儀器。盡管它們都提供了卓越的測量能力,但各自的設(shè)計理念和性能側(cè)重點卻大不相同。 本文將深入剖析這兩款儀器的技術(shù)規(guī)格,幫助您做出最佳的選型決策。 一、 核心性能概覽 首先,我們可以通過下表快速了解兩款儀器的核心差異: 特性 Keysight E4991B Keysight
    的頭像 發(fā)表于 02-06 15:39 ?411次閱讀
    Keysight E4991B 與 E4990A 阻抗分析儀:深入技術(shù)對比與選型指南

    如何判斷廣州郵科逆變電源是電力用還是通信用?看這幾個關(guān)鍵區(qū)別就夠了!

    在電力系統(tǒng)和通信系統(tǒng)中,逆變電源都扮演著至關(guān)重要的角色,但兩者的技術(shù)要求卻大不相同。一臺設(shè)計用于通信機房的逆變電源,如果誤用在電力系統(tǒng),可能會導(dǎo)致保護誤動;反之亦然。今天我們就來詳細解析,如何準確判斷廣州郵科的逆變電源究竟是電力專用型還是通信專用型。
    的頭像 發(fā)表于 01-27 10:41 ?397次閱讀
    如何判斷廣州郵科逆變電源是電力用還是通信用?看這幾個關(guān)鍵區(qū)別就夠了!

    AI硬件全景解析:CPU、GPU、NPU、TPU的差異化之路,一文看懂!?

    CPU作為“通用基石”,支撐所有設(shè)備的基礎(chǔ)運行;GPU憑借并行算力,成為AI訓(xùn)練與圖形處理的“主力”;TPU在Google生態(tài)中深耕云端大模型訓(xùn)練;NPU則讓AI從“云端”走向“身邊”(手機、手表
    的頭像 發(fā)表于 12-17 17:13 ?2367次閱讀
    AI硬件全景解析:<b class='flag-5'>CPU</b>、<b class='flag-5'>GPU</b>、NPU、TPU的差異化之路,一文看懂!?

    分塊延遲渲染架構(gòu)能否在桌面領(lǐng)域立足?

    在桌面市場,顯卡所需的GPUIP要求則大不相同:高性能:主流顯卡需達到20TFLOPS算力與300GPixel/s渲染能力方能立足;高端游戲顯卡的性能標準更為嚴苛先
    的頭像 發(fā)表于 11-25 08:34 ?775次閱讀
    分塊延遲渲染架構(gòu)能否在桌面領(lǐng)域立足?

    SPI、I2C、I2S、UART:通信協(xié)議解釋

    ? ? ? ? 在嵌入式開發(fā)中,最常用的幾種通信接口無非就是SPI、I2C、I2S、UART。名字看起來差不多,但應(yīng)用場景和特性卻大不相同。為什么都叫串行通信,結(jié)構(gòu)卻不一樣?為什么有的能傳音頻,有的
    的頭像 發(fā)表于 11-18 10:53 ?737次閱讀

    SPI、I2C、I2S、UART:通信協(xié)議對比表

    在嵌入式開發(fā)中,最常用的幾種通信接口無非就是SPI、I2C、I2S、UART。名字看起來差不多,但應(yīng)用場景和特性卻大不相同。很多初學(xué)者容易混淆:為什么都叫串行通信,結(jié)構(gòu)卻不一樣?為什么有的能傳音頻
    的頭像 發(fā)表于 11-17 10:53 ?2184次閱讀
    SPI、I2C、I2S、UART:通信協(xié)議對比表

    實現(xiàn)環(huán)境計算真正的瓶頸究竟在哪

    20世紀90年代初,計算機科學(xué)家Mark Weiser提出了“泛在計算”的理念,其核心思想是讓技術(shù)融入日常生活環(huán)境中[1]。盡管智能家居組件、傳感器網(wǎng)絡(luò)和智能設(shè)備取得了進展,但環(huán)境計算這一概念依然難以實現(xiàn)。如今,我們已經(jīng)擁有了硬件基礎(chǔ)和連接能力。那么,真正的瓶頸究竟在哪里?
    的頭像 發(fā)表于 09-10 16:21 ?1000次閱讀

    CPUGPU,渲染技術(shù)如何重塑游戲、影視與設(shè)計?

    渲染技術(shù)是計算機圖形學(xué)的核心內(nèi)容之一,它是將三維場景轉(zhuǎn)換為二維圖像的過程。渲染技術(shù)一直在不斷演進,從最初的CPU渲染到后來的GPU渲染,性能和質(zhì)量都有了顯著提升。從CPUGPU:技術(shù)
    的頭像 發(fā)表于 09-01 12:16 ?1161次閱讀
    從 <b class='flag-5'>CPU</b> 到 <b class='flag-5'>GPU</b>,渲染技術(shù)如何重塑游戲、影視與設(shè)計?

    如何計算孔板流量計和平衡流量計的流量?計算公式一樣嗎?

    平衡流量計與孔板流量計作為差壓式流量計的典型代表,雖均基于壓力差與流量的數(shù)學(xué)關(guān)系進行計算,但是平衡流量計計算公式和孔板流量計的計算公式大不相同,其核心公式、參數(shù)修正及適用場景存在顯著差異。這種
    的頭像 發(fā)表于 07-09 13:54 ?1185次閱讀
    如何計算孔板流量計和平衡流量計的流量?計算公式一樣嗎?

    佳金源錫膏廠家為你總結(jié)錫膏的熔點為什么不相同

    熔點是固體將其物態(tài)由固態(tài)轉(zhuǎn)變或熔化為液態(tài)的溫度,那么關(guān)于錫膏的熔點,也是錫膏的膏體從膏狀經(jīng)高溫后熔化的溫度,我們平時所看到的錫膏是有很多種類的,不同類的錫膏熔點是不一樣的;錫膏是由不同的金屬粉末按一定比例與助焊劑或其他粉末合成的膏狀物料,而合金金屬成分的不同是導(dǎo)致錫膏熔點的差異的主要因素之一。
    的頭像 發(fā)表于 07-02 17:09 ?1619次閱讀
    佳金源錫膏廠家為你總結(jié)錫膏的熔點為什么<b class='flag-5'>不相同</b>?

    選晶振必須了解的:石英晶振分類全解析!

    在電子設(shè)備的設(shè)計制造當中,石英晶振不可或缺,它為系統(tǒng)提供著穩(wěn)定而精準的頻率基準,保障著電子器械的正常運行,常被譽為電子產(chǎn)品的“心臟”。石英晶振的種類繁多,不同分類的晶振應(yīng)用場景也大不相同。按封裝形式
    的頭像 發(fā)表于 06-12 10:00 ?1521次閱讀
    選晶振必須了解的:石英晶振分類全解析!

    UVC相機識別不到是什么原因導(dǎo)致的?

    我做了兩版硬件,一版可以識別到fx3相機,另一版找不到。 但是兩版都能測試USBBulkSourceSink.img,并且速率都在4Gbps以上。 有區(qū)別的是不能識別fx3相機的版本用的是52m的參考時鐘, 請問下可能的原因在哪里?
    發(fā)表于 05-22 06:53

    PLC為什么容易燒壞?主要原因在哪里?

    PLC(可編程邏輯控制器)作為工業(yè)自動化控制的核心設(shè)備,其穩(wěn)定性和可靠性直接影響生產(chǎn)線的運行效率。然而,在實際應(yīng)用中,PLC燒毀的故障并不罕見,這不僅會導(dǎo)致設(shè)備停機,還可能引發(fā)安全隱患。那么,究竟
    的頭像 發(fā)表于 05-12 08:42 ?3854次閱讀
    PLC為什么容易燒壞?主要<b class='flag-5'>原因在哪</b>里?
    莱西市| 璧山县| 边坝县| 和田市| 准格尔旗| 镇宁| 百色市| 东港市| 桑植县| 巴楚县| 奉化市| 东乡族自治县| 铜鼓县| 南川市| 庆云县| 溧水县| 桐乡市| 涡阳县| 苏尼特右旗| 双江| 大邑县| 静海县| 红原县| 扎鲁特旗| 临沭县| 汉源县| 岚皋县| 顺平县| 乡宁县| 类乌齐县| 新安县| 连平县| 淄博市| 芮城县| 佛山市| 阿巴嘎旗| 广灵县| 吉水县| 法库县| 新晃| 霸州市|