日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

淺談GPU: 衡量計算效能的正確姿勢(3)

Linux閱碼場 ? 來源:面包板社區(qū) ? 作者:Linux閱碼場 ? 2021-04-16 11:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

上期我們講了現(xiàn)代計算機體系結(jié)構(gòu)通過處理器(CPU/GPU)和內(nèi)存的交互來執(zhí)行計算程序,處理輸入數(shù)據(jù),并輸出結(jié)果。實際上,由于CPU是高速器件,而內(nèi)存訪問速度往往受限(如圖所示,CPU和內(nèi)存的性能差距從上個世紀(jì)80年代開始,不斷拉大),為解決速度匹配的問題,在CPU和內(nèi)存之間設(shè)置了高速緩沖存儲器Cache。

04180576-9e23-11eb-8b86-12bb97331649.png

而且Cache往往分幾個層級,與內(nèi)存以及其它外部存儲器共同構(gòu)成計算機系統(tǒng)的存儲器層次結(jié)構(gòu)(Memory Hierarchy),如下圖所示,使得整個系統(tǒng)在性能,成本和制造工藝達(dá)到平衡。

045341ae-9e23-11eb-8b86-12bb97331649.jpg

我們可以看到,各個存儲層次在訪問時間上存在數(shù)量級別的差異,訪問速度越快,單位制造成本越高,容量越小。在這里,我們并不打算討論Cache具體設(shè)計和實現(xiàn),只是希望針對Cache及其命中率對性能的影響有一個直觀的認(rèn)識。為了簡化討論問題的復(fù)雜性,我們這里做如下假設(shè)。

整個流水線分為5個階段,分別為《1》取指、《2》譯碼、《3》運算執(zhí)行、《4》訪存讀寫 (可選)、《5》寫回結(jié)果至寄存器。

這里只考慮一級Cache,而且指令、數(shù)據(jù)共享L1 Cache。Cache命中的情況下,每個階段都是1個時鐘(cycle),而cache不命中的情況,階段《1》,《5》各耗時100個時鐘(cycles)。

訪存指令占所有指令1/3。下面我們來分別計算3種情況下的CPI。

= 100 cycles + 3 * (1 cycle) + ((1 cycle * 2/3) + (100 cycles * 1/3))

= 137 cycles.

= (1 cycle * 0.9 + 100 cycles * (1 - 0.9)) + (3 cycles) + ((1 cycle * (2/3 + 0.9/3)) + (100cycles * (1 - 0.9) * 1/3))

= 18.2 cycles.

= (1 cycle * (0.99) + 100 cycles * (1 - 0.99)) + (3 cycles) + ((1 cycle * (2/3 + 0.99/3)) + (100 cycles * (1 - 0.99) * 1/3))

= 6.32 cycles.

Cache完全缺失。

CPI = 《1》階段的時鐘+《2, 3, 5》階段的時鐘+《4》階段的時鐘

Cache命中率達(dá)到90%。

CPI = 《1》階段的時鐘+《2, 3, 5》階段的時鐘+《4》階段的時鐘

Cache命中率達(dá)到99%

CPI = 《1》階段的時鐘+《2, 3, 5》階段的時鐘+《4》階段的時鐘另外在上期文章里我們也提到同樣32b數(shù)據(jù)的訪問,DRAM的耗能是SRAM的百倍(640pJ vs 5pJ)。完全可見正確配置Cache對高能效高性能計算的重要作用。

值得一提的是,由于CPU和GPU設(shè)計面向的差異,他們的Memory Hierarchy存在明顯的區(qū)別,一個典型的對比如下圖,可以看到GPU的Memeory Hierarchy設(shè)計的時候更注意帶寬或者說Throughput,而相比之下對Latency就沒有CPU重視, GPU Cache容量也相對比較小。

045d4bae-9e23-11eb-8b86-12bb97331649.png

那我們不禁要問,GPU的Latency指標(biāo)這么糟糕,按照我們先前的計算,Cache不命中的后果是不是很嚴(yán)重?不過不要擔(dān)心,CPU的Cache不命中可能會導(dǎo)致叫停流水線的嚴(yán)重后果,而對GPU,只要計算任務(wù)量足夠,它的硬件調(diào)度器(Hardware Scheduler)能夠自動在不同的任務(wù)間無縫切換,來掩藏特定任務(wù)訪問memory帶來的延遲。關(guān)于GPU的Latency hiding,值得大書特書,我們以后會詳細(xì)討論。
編輯:lyn

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11332

    瀏覽量

    226003
  • Cache
    +關(guān)注

    關(guān)注

    0

    文章

    130

    瀏覽量

    29798

原文標(biāo)題:GPU: 衡量計算效能的正確姿勢(3)

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    成功案例:象帝先計算技術(shù)與Imagination合作——面向現(xiàn)代圖形與計算工作負(fù)載的專業(yè)GPU

    為專業(yè)計算設(shè)計桌面GPU桌面GPU不僅用于游戲,還能加速從專業(yè)可視化、高級模擬到數(shù)據(jù)密集型計算在內(nèi)的多種現(xiàn)代工作負(fù)載。專業(yè)用戶需要能在多種應(yīng)用場景中穩(wěn)定運行的高性能、多功能平臺。構(gòu)建桌
    的頭像 發(fā)表于 03-09 09:17 ?489次閱讀
    成功案例:象帝先<b class='flag-5'>計算</b>技術(shù)與Imagination合作——面向現(xiàn)代圖形與<b class='flag-5'>計算</b>工作負(fù)載的專業(yè)<b class='flag-5'>GPU</b>

    上海晶珩IPC1100樹莓派CM0計算機:小身材,高性價比的工業(yè)利器!

    穩(wěn)定,滿足工業(yè)輕量計算需求 IPC1100搭載樹莓派自研RP3A0?SIP 芯片組,其核心為?4 核 64 位 Arm Cortex-A53 處理器,主頻高達(dá)?1GHz,并配備?VideoCore IV
    的頭像 發(fā)表于 12-25 11:49 ?574次閱讀
    上海晶珩IPC1100樹莓派CM0<b class='flag-5'>計算</b>機:小身材,高性價比的工業(yè)利器!

    炎核開源開放平臺上架推出OpenSparseBlas高性能稀疏計算

    在科學(xué)計算與工程仿真領(lǐng)域,高效處理大規(guī)模稀疏矩陣運算是提升整體計算效能的關(guān)鍵。為此,我們在炎核開源開放平臺上架推出 OpenSparseBlas——一個專為稀疏矩陣/向量計算而打造的高
    的頭像 發(fā)表于 12-15 15:18 ?1006次閱讀

    汽車中的GPU是如何使用的?

    (HMI)的發(fā)展尤為迅猛。隨著電子電氣架構(gòu)(EEA)的集中化,車輛對高性能計算能力的需求顯著提升,GPU(圖形處理單元)的靈活性、可擴展性以及高效并行計算能力,使其成為支持這些創(chuàng)新應(yīng)用的核心組件
    的頭像 發(fā)表于 12-03 14:45 ?9726次閱讀
    汽車中的<b class='flag-5'>GPU</b>是如何使用的?

    分體電磁流量計正確接線方法!

    量計
    jzyb
    發(fā)布于 :2025年10月24日 18:18:36

    絕緣子漏電起痕試驗儀泄漏電流信號的小波變換分析及電弧能量計算

    手段;而基于該分析結(jié)果的電弧能量計算,則能量化電弧對絕緣子性能的影響,兩者共同為試驗結(jié)果的精準(zhǔn)解讀與絕緣子耐痕性能評估提供科學(xué)依據(jù)。? 泄漏電流信號的小波變換分析,核心在于對信號的“分層解析與特征提取”。試
    的頭像 發(fā)表于 10-15 09:43 ?556次閱讀
    絕緣子漏電起痕試驗儀泄漏電流信號的小波變換分析及電弧能<b class='flag-5'>量計算</b>

    如何正確使用分體式電磁流量計?

    量計
    jzyb
    發(fā)布于 :2025年09月16日 18:05:13

    一步步教你正確的電磁流量計安裝

    在電磁流量計安裝過程中,您是否遇到過流量計測量不準(zhǔn)、維修困難甚至徹底失效的問題?很多時候,并不是儀表本身有問題,而是安裝細(xì)節(jié)被忽略了。電磁流量計直管段不夠、孔板流量計差壓變送器安裝位置
    的頭像 發(fā)表于 09-06 10:38 ?4429次閱讀
    一步步教你<b class='flag-5'>正確</b>的電磁流<b class='flag-5'>量計</b>安裝

    別讓 GPU 故障拖后腿,捷智算GPU維修室來救場!

    在AI浪潮洶涌的當(dāng)下,GPU已然成為眾多企業(yè)與科研機構(gòu)的核心生產(chǎn)力。從深度學(xué)習(xí)模型訓(xùn)練,到影視渲染、復(fù)雜科學(xué)計算GPU憑借強大并行計算能力,極大提升運算效率。然而,就像高速運轉(zhuǎn)的精密
    的頭像 發(fā)表于 07-17 18:56 ?1337次閱讀
    別讓 <b class='flag-5'>GPU</b> 故障拖后腿,捷智算<b class='flag-5'>GPU</b>維修室來救場!

    如何選擇合適的電池電量計

    最優(yōu)的電池性能依賴于驅(qū)動電量計算法的高精度的電池模型?;ㄙM大量時間進(jìn)行定制特征分析能夠獲得高精度電池性能、最大程度減小電池電量的(SOC)誤差,以及正確預(yù)測電池何時接近空電量。
    發(fā)表于 07-10 14:23 ?0次下載

    如何計算孔板流量計和平衡流量計的流量?計算公式一樣嗎?

    平衡流量計與孔板流量計作為差壓式流量計的典型代表,雖均基于壓力差與流量的數(shù)學(xué)關(guān)系進(jìn)行計算,但是平衡流量計
    的頭像 發(fā)表于 07-09 13:54 ?1190次閱讀
    如何<b class='flag-5'>計算</b>孔板流<b class='flag-5'>量計</b>和平衡流<b class='flag-5'>量計</b>的流量?<b class='flag-5'>計算</b>公式一樣嗎?

    GPU架構(gòu)深度解析

    GPU架構(gòu)深度解析從圖形處理到通用計算的進(jìn)化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行
    的頭像 發(fā)表于 05-30 10:36 ?2044次閱讀
    <b class='flag-5'>GPU</b>架構(gòu)深度解析

    自己動手繞線圈電感詳細(xì)計算公式(建議收藏!)

    線圈高度W----線圈寬度單位分別為毫米和mH。空心線圈電感量計算公式:l=(0.01*D*N*N)/(L/D+0.44)線圈電感量l單位:微亨線圈直徑D單位:cm線圈匝數(shù)N單位:匝線圈長度L單位:cm 獲取完整文檔資料可下載附件哦?。。。?如果內(nèi)容有幫助可以關(guān)注、點贊、評論支持一下哦~
    發(fā)表于 05-28 16:57

    Imagination與澎峰科技攜手推動GPU+AI解決方案,共拓計算生態(tài)

    近日, Imagination Technologies 與國內(nèi)領(lǐng)先的異構(gòu)計算軟件與智算混合云服務(wù)提供商 澎峰科技 ( PerfXLab )正式簽署合作備忘錄( MoU ),圍繞 GPU 與 AI
    發(fā)表于 05-21 09:40 ?1300次閱讀

    求助,關(guān)于FX3使用SDK自帶回環(huán)固遇到的問題求解

    和數(shù)據(jù)量計算速度,這樣的測試是否準(zhǔn)確?我沒到的速度只是19MB多點為什么?剛開始我懷疑是我的電路板布線的問題,所以我找了個開發(fā)板,速度仍然是19MB多點?所以我再想這樣的測試方法本身是否可行?因為我的開發(fā)板本身的FPGA壞了,在這種情況下只能使用回環(huán)沒速了吧
    發(fā)表于 05-08 07:05
    牟定县| 邓州市| 红河县| 隆昌县| 固原市| 汶川县| 贵溪市| 惠水县| 鹤岗市| 福清市| 嘉兴市| 集安市| 甘洛县| 乳山市| 辽宁省| 阿尔山市| 华容县| 额济纳旗| 日照市| 化德县| 玛沁县| 恩平市| 新邵县| 四平市| 永定县| 苗栗市| 开江县| 邯郸市| 鄢陵县| 都兰县| 通州市| 龙井市| 博野县| 乐平市| 连山| 高台县| 双桥区| 台山市| 论坛| 习水县| 闽侯县|