日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

CPU共享資源隔離的利器MPAM特性介紹

Linux閱碼場 ? 來源:openEuler ? 作者:汪少博 ? 2021-04-20 11:23 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

MPAM(Memory System Resource Partitioning and Monitoring)[1]特性用于解決混部業(yè)務時由于共享資源競爭帶來的性能下降問題,MPAM 作為繼 x86 RDT[2]技術后的另一個針對 CPU 訪存系統(tǒng)資源隔離的全新特性倍受關注,相比其他架構的類似特性,Arm64 架構下的 MPAM 特性采用全新的確定性流控方式,控制手段更加豐富,控制對象覆蓋更廣,目前在鯤鵬服務器上的應用取得了良好的結果。openEuler kernel 已于 openEuler 21.03 創(chuàng)新版本支持 MPAM,成為首個同時支持 x86 RDT 和 MPAM 的開源平臺;MPAM 項目組聯(lián)合下游各大廠商及研究機構在 POC 場景上做了驗證,使能 MPAM 并在云場景下進行了多個測試點的適配和測試,解決了不同虛擬機因為 Cache 和訪存干擾帶來的性能干擾問題,目前已具備相當?shù)某墒於?;為支撐下游廠商使用 MPAM,構建完整端到端基礎軟件棧,項目組后續(xù)還會在 openEuler 推出一系列配套調測工具和部署軟件。

特性介紹

如何處理諸如 L3 Cache 等內存系統(tǒng)資源競爭的問題一直是業(yè)界研究的焦點,例如 Kpart[3],DICER[4],dcat[5],這些研究為工業(yè)界應用共享資源隔離技術打下了基礎。MPAM 是 Arm Architecture v8.4 的 Extension 特性,其目的是用于解決服務器系統(tǒng)中,混部不同類型業(yè)務時,由于 CPU 訪存過程中共享資源的競爭帶來的某些關鍵應用性能下降或者系統(tǒng)整體性能下降的問題。

e81ae754-a100-11eb-8b86-12bb97331649.jpg

MPAM 系統(tǒng)框架參考圖 1,相比其他架構的類似特性,MPAM 設計上參考了更多前沿技術,MPAM 最顯著的特征是:

提供更多控制手段,針對 Cache 資源以及訪存通道,增加了對訪存流的優(yōu)先級控制和完全隔離控制;

按照 Cache way 為粒度,以 bitmap 的形式分配 Cache way,不要求所分配的 Cache way 在 bitmap 中連續(xù);

MPAM 支持在虛擬機內部劃分共享資源;

MPAM 增加了對 SMMU 的支持,可以限制 IO 設備對 Cache 和相關內存系統(tǒng)資源的使用;

從體系結構角度優(yōu)化·最佳配置,在對訪存流的限制上,MPAM 流控方式可精確控制訪存流百分比,可以確定性地保障訪存敏感型業(yè)務的性能。

e83288be-a100-11eb-8b86-12bb97331649.jpg

圖 2 MPAM 和 RDT L3 Cache 控制方式異同 如圖 2,MPAM 規(guī)定配置 Cache 主要有兩種方式,一種是通過優(yōu)先級配置,這種情況下,優(yōu)先級高的業(yè)務流將優(yōu)先使用 Cache 的使用權;第二種是以 Cache way 為粒度,按照 bitmap 形式隔離不同業(yè)務對 Cache 的使用,不要求 Cache way 分配連續(xù),這也是目前鯤鵬 920 采取的控制方式。x86 RDT 目前僅支持第二種,且大部分型號要求 Cache way 分配連續(xù)[6]。圖 3 為鯤鵬 920 和常用 x86 型號 RDT 特性對流量控制的比較,對比其他架構的類似特性,MPAM 在流量控制上的最大特點是參考當前 DDR 通道的傳輸能力,從而對業(yè)務流限制一個明確的上下限,若當前受控流量超過該 DDR 通道設定百分比對應的上限流量時,則限制到該百分比以下,同時在小于下限流量時享有優(yōu)先訪問權。對比 x86 RDT,其限制流量的動作發(fā)生在 L2 和 L3 之間,使用給受控流量主動加時延的方式降低目標流量[6]。

e84aa1a6-a100-11eb-8b86-12bb97331649.jpg

圖 3 鯤鵬 920 MPAM 與 x86 RDT 流量限制上的異同 除此之外,MPAM 協(xié)議規(guī)定了額外兩種流量控制方式,如圖 4 所示,一種是采用 bitmap 的方式完全隔離開不同的業(yè)務流,被隔離的業(yè)務流將會按照 bitmap 劃分的時間片分區(qū)間輪詢使用訪存通道;第二種,在第一種方式的基礎上,還可使用優(yōu)先級方式調整業(yè)務流的優(yōu)先級,在發(fā)生訪存擁擠時,同一時刻高優(yōu)先級業(yè)務流將優(yōu)先享有該 DDR 通道。

e88eb378-a100-11eb-8b86-12bb97331649.jpg

圖 4 MPAM 帶寬的完全隔離和優(yōu)先級控制方式 MPAM 可以在更多維度靈活配置業(yè)務對 Cache 和帶寬的使用,適應更多的應用場景,易于獲得更大的優(yōu)化空間。

特性使能

硬件支持:鯤鵬 920[7]

BIOS 支持:Taishan 170 及更新版本

內核支持:openEuler 21.03 或 openEuler 20.03 LTS SP1[8]

用戶手冊:https://gitee.com/openeuler/openRSO/blob/master/docs/manual/arm_mpam_resctrlfs_user_interface.md

鯤鵬 920 已支持 MPAM 特性的部分功能,如圖 5 所示:

e8c0ca8e-a100-11eb-8b86-12bb97331649.jpg

圖 5 鯤鵬 920 MPAM 所使能功能

cpbm: Cache Portion Bit Map,按照位圖控制分配特定容量和特定位置的 L3 Cache,其中每個 bit 代表一條 Cache way;

max: Memory Bandwidth Maximum Partition,按照能夠通過受控 DDR 通道最大帶寬的百分比進行訪存流量限制;

min: Memory Bandwidth Minimum Partition,提供最小帶寬百分比表示允許通過受控 DDR 通道的容量,小于最小百分比將享受較高優(yōu)先級的通過權;

hdl: Memory Bandwidth Hard Limit,開啟會使得分區(qū)的帶寬使用率降至最大帶寬控制的范圍之內,參考 Max,否則,只有在通道擁擠時才會做適當限制;

Monitoring: Cache/Memory Bandwidth monitoring,對 L3 Cache 占用大小和訪存帶寬大小進行實時監(jiān)控。

性能測試

硬件平臺:鯤鵬 920 @CORE 96 2.6GHZ

DDR:Configured Memory Speed: 2666 MT/s

OS:openEuler 21.03

BIOS:Taishan 170

基礎功能指標

e8cd24e6-a100-11eb-8b86-12bb97331649.jpg

圖 6 實驗一 MPAM 單 workload L3 Cache 分配和監(jiān)控實驗一

workload: numactl –m 0 bw_mem –P 8 –N 4 128M rd如圖 6 所示,啟動一個 workload,workload 也可自行選擇,對 L3 Cache 按 cpbm 分配,通過 MPAM 的 monitor 查看 workload 占用的 L3 Cache 容量變化,可見 workload 真實占用的 Cache 容量和理論大小基本一致。

e8d9a342-a100-11eb-8b86-12bb97331649.jpg

圖 7 實驗二 MPAM 雙 workload Cache 隔離實驗二

workload1: numactl –m 0 stress-ng –cache 10 --aggressive workload2: numactl –m 0 bw_mem –P 8 –N 4 128M rd如圖 7 所示,啟動兩個 workload,使用 cpbm 方式對兩個 workload 做 Cache 隔離測試,通過 MPAM 的 monitor 查看 workload 占用的 L3 Cache 容量變化,該測試分為兩部分,前四組為 Cache way 完全隔離測試,后兩組為 overlap 測試,可見 Cache 隔離效果與理論值基本一致,后兩組實際效果與 workload 對 Cache 的占用強度有關。

e8e5fea8-a100-11eb-8b86-12bb97331649.jpg

圖 8 實驗三帶寬最大百分比調控實驗三

workload: numactl –m 0 bw_mem –P 8 –N 4 128M rd如圖 8 所示,在大流量下和中小流量下(當前 DDR 通道最大帶寬約為 75MB/S)對帶寬做最大百分比調控,通過 MPAM monitor 查看 workload 對應流量大小變化,可見流量控制效果基本與預期相符,鯤鵬 920 上 MPAM 設定的帶寬控制有效百分比約在 20%-80%。

spec CPU 2006 測試

選用 spec CPU 2006 omnet 測試套和 spec CPU 2006 milc,分析 Cache 干擾:cpu+內存型業(yè)務混合部署場景下,通過 CPBM 隔離 L3 Cache 可以削弱不同業(yè)務對 Cache 的競爭,提升性能,如圖 9 所示,非隔離時兩種業(yè)務之的 Cache 實際占用大小波動非常大,這是造成性能下降的主要原因。

e9169932-a100-11eb-8b86-12bb97331649.jpg

圖 9 MPAM spec 2006 L3 Cache 隔離測試[9] 通過對兩組業(yè)務的 Cache 進行完全隔離,可以看到隔離后的業(yè)務 Cache 實際占用大小波動明顯減少,對比不做隔離的情況,omnet 業(yè)務最終獲得了 10+%的性能提升,milc 業(yè)務性能也略有提升。

DPDK 隔離帶寬干擾

裸機場景下,使用 pktgen+DPDK 進行試驗,并對 DPDK 施加帶寬壓力,使用 MPAM 對比隔離前后 DPDK 性能變化:

solo加壓加壓+MPAM限制帶寬20%

每秒平均指令數(shù)2E+09 + 5E+071.7E+092E+09 + 4E+07

指令數(shù)下降比NA22%0.7%

dpdk性能下降NA≈21%≈0

如表 1 所示,可知加壓后導致性能退化 22%左右,加壓參數(shù)參考[9],使用 MPAM 限制壓力程序 20%帶寬,DPDK 性能恢復正常。

e926fa16-a100-11eb-8b86-12bb97331649.jpg

圖 10 RDT 和 MPAM DPDK 場景測試[10][11]

內存大頁+Cache 隔離

如圖 11 所示,網(wǎng)絡轉發(fā)業(yè)務選用 2G 內存大頁,左圖不同線程之間存在穩(wěn)定的 Cache 干擾,右圖表示性能下降比例,通過隔離 Cache 可消除該干擾,保證關鍵業(yè)務的性能。

e93291c8-a100-11eb-8b86-12bb97331649.jpg

圖 11 內存大頁和 MPAM Cache 隔離測試網(wǎng)絡轉發(fā)業(yè)務[9]

開放生態(tài)

資源隔離是 OS 中非常重要的一個組成部分,針對 cpu 核訪存?zhèn)鹊母綦x技術又是資源隔離中的一個重要組成部分,如何規(guī)劃好未來對內存系統(tǒng)資源的高效使用,對保障業(yè)務在更加復雜的平臺上穩(wěn)定運轉至關重要。為減少跨平臺成本,豐富調試手段,提升業(yè)務部署效率,我們希望歸一化不同架構的輸出接口,開放應用端到端統(tǒng)一部署框架,針對不同場景定制化通用化的資源隔離調度引擎,構建一整套應用資源管理基礎軟件棧。

e93be6ec-a100-11eb-8b86-12bb97331649.jpg

圖 12 共享資源調控基礎軟件框架我們計劃在 openEuler 開源一套共享資源調控基礎軟件框架,用于跨平臺統(tǒng)一管理業(yè)務使用 Cache 及相關內存系統(tǒng)資源,通過引入豐富、實用的調試工具幫助用戶排查相關性能問題,并增加通用資源調度引擎處理針對不同場景下的資源動態(tài)調控問題,按照部署業(yè)務的層級整合和編排共享資源的使用,方便用戶部署業(yè)務和整合系統(tǒng)資源分配。針對 MPAM 技術,目前已和通信行業(yè)、電商、云服務商等合作領域企業(yè)進行溝通合作,并已在部分場景上取得成效,歡迎業(yè)界專家建言獻策,共同打造實用,穩(wěn)固,開放的底層資源隔離基礎軟件底座。

原文標題:openEuler 21.03 特性解讀 | CPU 共享資源隔離的利器 - MPAM

文章出處:【微信公眾號:Linuxer】歡迎添加關注!文章轉載請注明出處。

責任編輯:haq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11332

    瀏覽量

    226005

原文標題:openEuler 21.03 特性解讀 | CPU 共享資源隔離的利器 - MPAM

文章出處:【微信號:LinuxDev,微信公眾號:Linux閱碼場】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    探索AD7400A隔離Σ - Δ調制器:特性、應用與設計要點

    探索AD7400A隔離Σ - Δ調制器:特性、應用與設計要點 在電子設計領域,高精度模擬信號處理和隔離性能是許多應用的關鍵需求。AD7400A隔離Σ - Δ調制器憑借其卓越的性能,成為
    的頭像 發(fā)表于 03-30 09:45 ?359次閱讀

    ADuM7703 16 位隔離 Σ - Δ ADC 深度解析:特性、應用與設計要點

    ADuM7703 16 位隔離 Σ - Δ ADC 深度解析:特性、應用與設計要點 在電子工程領域,模擬 - 數(shù)字轉換器(ADC)是實現(xiàn)模擬信號數(shù)字化不可或缺的關鍵組件。今天要為大家詳細介紹
    的頭像 發(fā)表于 03-27 14:55 ?153次閱讀

    隔離、非反射GaAs SPDT開關HMC349AMS8G的特性與應用

    隔離、非反射GaAs SPDT開關HMC349AMS8G的特性與應用 在電子工程領域,開關器件是信號路由和控制的關鍵組件。今天要給大家介紹一款高性能的開關產品——Analog Devices
    的頭像 發(fā)表于 03-17 15:30 ?210次閱讀

    LTC6820 isoSPI隔離通信接口:設計、特性與應用詳解

    LTC6820 isoSPI隔離通信接口:設計、特性與應用詳解 在電子設計領域,隔離通信接口的性能直接影響著系統(tǒng)的穩(wěn)定性和可靠性。LTC6820作為一款具有獨特優(yōu)勢的isoSPI隔離
    的頭像 發(fā)表于 03-12 17:00 ?720次閱讀

    RK3588 CPU?隔離:AB/非?AB?系統(tǒng)雙方案適配實戰(zhàn)

    在RK3588嵌入式產品開發(fā)中,CPU隔離是提升系統(tǒng)實時性的核心手段,能讓關鍵任務獨占核心資源,規(guī)避系統(tǒng)調度與中斷干擾。本次基于RK3588原廠SDK, 同時實現(xiàn)AB/非AB兩種系統(tǒng)架構的CP
    的頭像 發(fā)表于 02-09 07:12 ?576次閱讀
    RK3588 <b class='flag-5'>CPU</b>?<b class='flag-5'>隔離</b>:AB/非?AB?系統(tǒng)雙方案適配實戰(zhàn)

    Texas Instruments ISO71xx系列數(shù)字隔離器:特性、應用與設計指南

    Texas Instruments ISO71xx系列數(shù)字隔離器:特性、應用與設計指南 引言 在電子工程領域,數(shù)字隔離器是保障系統(tǒng)安全和穩(wěn)定性的關鍵組件。Texas Instruments(TI
    的頭像 發(fā)表于 01-23 15:10 ?1002次閱讀

    ISO734x系列數(shù)字隔離器:設計利器,性能卓越

    ISO734x系列數(shù)字隔離器:設計利器,性能卓越 在電子工程師的日常設計工作中,數(shù)字隔離器是保障系統(tǒng)安全、穩(wěn)定運行的關鍵組件。今天,我們就來深入探討一下德州儀器(TI)的ISO734x系列數(shù)字
    的頭像 發(fā)表于 01-23 14:55 ?259次閱讀

    【喜報】觀巖科技獲發(fā)明專利授權,共享資源信號檢測技術再突破!?。?/a>

    喜訊來襲!成都觀巖科技有限公司自主研發(fā)的核心技術——“一種共享資源的突發(fā)信號檢測方法”,正式獲得國家發(fā)明專利授權。這一成果不僅是公司技術創(chuàng)新路上的又一重要里程碑,同時彰顯了觀巖科技在信號處理領域
    的頭像 發(fā)表于 01-09 17:09 ?360次閱讀
    【喜報】觀巖科技獲發(fā)明專利授權,<b class='flag-5'>共享資源</b>信號檢測技術再突破!??!

    UCC5390-Q1單通道隔離柵極驅動器:特性、應用與設計要點

    UCC5390-Q1單通道隔離柵極驅動器:特性、應用與設計要點 在功率半導體器件的驅動領域,一款性能優(yōu)良的隔離柵極驅動器至關重要。今天我們就來深入探討德州儀器(TI)的UCC5390-Q1單通道
    的頭像 發(fā)表于 01-08 14:15 ?331次閱讀

    BA60951CS 隔離反激變壓器:特性與應用全解析

    BA60951CS 隔離反激變壓器:特性與應用全解析 作為電子工程師,在設計電源電路時,變壓器的選擇至關重要。今天,我們就來深入了解一下 Bourns 公司的 BA60951CS 隔離反激變
    的頭像 發(fā)表于 12-23 16:35 ?426次閱讀

    ISO164x熱插拔雙向I2C隔離器:特性、應用與設計要點

    ISO164x熱插拔雙向I2C隔離器:特性、應用與設計要點 在電子工程師的日常設計中,可靠的通信隔離器件至關重要。ISO164x熱插拔雙向I2C隔離器憑借其卓越的性能和豐富的
    的頭像 發(fā)表于 12-17 14:15 ?1053次閱讀

    飛凌嵌入式ElfBoard-文件I/O的了解探究之競爭冒險

    競爭冒險(Race Condition)指的是在多線程或多進程環(huán)境中,多個線程或進程對共享資源進行訪問和修改時可能導致的不確定性結果或錯誤行為。競爭冒險通常發(fā)生在多個線程或進程同時訪問和修改共享資源
    發(fā)表于 11-26 15:38

    RFID標簽在共享經(jīng)濟的應用

    二、RFID標簽在共享經(jīng)濟中的優(yōu)勢1.高效率:RFID可以快速批量讀取信息,大幅縮短操作時間,提高管理效率。2.準確性:RFID減少了人工操作的錯誤率,提高了共享資源管理的準確性和可靠性。3.實時性
    的頭像 發(fā)表于 07-07 15:22 ?649次閱讀
    RFID標簽在<b class='flag-5'>共享</b>經(jīng)濟的應用

    高性能緩存設計:如何解決緩存?zhèn)?b class='flag-5'>共享問題

    在多核高并發(fā)場景下, 緩存?zhèn)?b class='flag-5'>共享(False Sharing) 是導致性能驟降的“隱形殺手”。當不同線程頻繁修改同一緩存行(Cache Line)中的獨立變量時,CPU緩存一致性協(xié)議會強制同步整個
    的頭像 發(fā)表于 07-01 15:01 ?903次閱讀
    高性能緩存設計:如何解決緩存?zhèn)?b class='flag-5'>共享</b>問題

    【EASY EAI Orin Nano開發(fā)板試用體驗】--WiFi連接與nfs共享

    的。 2.掛載服務器sudo mount -t nfs 192.168.3.214:/home/pengsir/nfsroot /home/orin-nano/Desktop/nfs -o nolock 3.查看共享目錄掛載情況,發(fā)現(xiàn)掛載上共享資源.
    發(fā)表于 06-29 21:56
    安顺市| 三江| 永吉县| 雷山县| 新密市| 朔州市| 丹东市| 土默特左旗| 竹北市| 平武县| 新安县| 靖江市| 长宁县| 留坝县| 高雄县| 三穗县| 即墨市| 繁峙县| 东阿县| 神池县| 毕节市| 苏州市| 阿荣旗| 修文县| 濮阳县| 三亚市| 竹溪县| 水富县| 年辖:市辖区| 上饶市| 遵义市| 当阳市| 潜江市| 新龙县| 南岸区| 吕梁市| 泰兴市| 德安县| 宜良县| 四川省| 蕉岭县|