日B视频 亚洲,啪啪啪网站一区二区,91色情精品久久,日日噜狠狠色综合久,超碰人妻少妇97在线,999青青视频,亚洲一区二卡,让本一区二区视频,日韩网站推荐

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

ARM64 Linux內(nèi)核頁表的塊映射

Linux閱碼場(chǎng) ? 來源:Linuxer ? 作者:Linuxer ? 2021-01-04 13:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

內(nèi)核文檔Documentation/arm64/memory.rst描述了ARM64 Linux內(nèi)核空間的內(nèi)存映射情況,應(yīng)該是此方面最權(quán)威文檔。

以典型的4K頁和48位虛擬地址為例,整個(gè)內(nèi)核空間的虛擬地址分布如下:

173d710c-4e4d-11eb-8b86-12bb97331649.png

從ffff000000000000到ffff7fffffffffff是一段針對(duì)物理地址的線性映射區(qū),最大支持128TB的物理地址空間,這一段地址非常類似ARM32的low memory映射區(qū)。

我們看看這種情況下的頁表,我們既可以用最終的【20:12】對(duì)應(yīng)的PTE映射項(xiàng),以4K為單位,進(jìn)行虛擬地址到物理地址的映射;又可以以【29:21】對(duì)應(yīng)的PMD映射項(xiàng),以2M為單位,進(jìn)行虛擬地址到物理地址的映射。

1764476e-4e4d-11eb-8b86-12bb97331649.png

對(duì)于用戶空間的虛擬地址而言,當(dāng)我們進(jìn)行的是PMD映射的時(shí)候,我們得到的是Huge Page,ARM64的2MB的huge page,在虛擬和物理上都連續(xù),它在實(shí)踐工程中的好處是,可以減小TLB miss,因?yàn)?,如果進(jìn)行了2MB的映射,整個(gè)2MB不再需要PTE,映射關(guān)系大為減小。

178dd1ce-4e4d-11eb-8b86-12bb97331649.png

對(duì)于內(nèi)核空間而言,從ffff000000000000到ffff7fffffffffff的這段虛擬地址,如果與物理地址進(jìn)行的是一種PMD映射的話,顯然也可以達(dá)到同樣的效果。但是,這不意味著它們就是Huge Page。眾所周知,內(nèi)核開機(jī)把物理地址往虛擬地址進(jìn)行線性映射,并不意味著這片內(nèi)存被內(nèi)核拿走了,它只是進(jìn)行了一種映射,以便日后調(diào)用kmalloc(),get_free_pages()等API申請(qǐng)的內(nèi)存是直接已經(jīng)有虛實(shí)映射的。所以,即便內(nèi)核進(jìn)行的就是PMD映射,在內(nèi)存的分割上,還是可以以4K為單位的:

17c8ca68-4e4d-11eb-8b86-12bb97331649.png

所以,即便我們?cè)趦?nèi)核空間進(jìn)行PMD映射,里面的每個(gè)藍(lán)色圓圈(一個(gè)4K頁),還是可以被單獨(dú)分配的,這種分配可以是kmalloc、vmalloc,用戶態(tài)的malloc等。內(nèi)核態(tài)進(jìn)行的PMD映射,不意味著相關(guān)的2MB成為了huge page,它純粹只是為了服務(wù)于當(dāng)內(nèi)核以線性映射的虛擬地址訪問該物理地址的時(shí)候(我們認(rèn)為內(nèi)核大多數(shù)時(shí)候是用這個(gè)線性映射的虛擬地址的),減小TLB miss。

當(dāng)然,更牛逼的情況下,內(nèi)核應(yīng)該也可以直接用【38:30】位的PUD來進(jìn)行映射,這樣映射關(guān)系是1GB的,則整個(gè)1GB后面占TLB的時(shí)候,只需要占一個(gè)入口。

1835a250-4e4d-11eb-8b86-12bb97331649.png

當(dāng)然,如果用戶態(tài)的虛實(shí)映射是這樣的,用戶實(shí)際得到了一個(gè)1GB的巨頁。但是對(duì)于內(nèi)核的線性映射區(qū)域而言,即便我們進(jìn)行了1GB的PUD映射,這1G內(nèi)部就可以進(jìn)一步切割為4KB頁或者2MB的巨頁。記?。簝?nèi)核態(tài)的線性映射區(qū)的映射只是個(gè)映射關(guān)系,不是個(gè)分配關(guān)系。比如下面的1GB的內(nèi)核線性映射的1GB區(qū)域,仍然可以被4K分配走,或者被用戶以huge page以2MB為單位分配走:

185868b2-4e4d-11eb-8b86-12bb97331649.png

我們需要一個(gè)真實(shí)的調(diào)試手段來驗(yàn)證我們的想法,這個(gè)調(diào)試手段就是PTDUMP(Page Table Dump),相關(guān)的代碼在ARM64內(nèi)核的:

arch/arm64/mm/ptdump.c和ptdump_debugfs.c

我們把它們?nèi)窟x中,這樣我們可以得到一個(gè)debugfs接口

/sys/kernel/debug/kernel_page_tables

來獲知內(nèi)核態(tài)頁表的情況。

我用qemu啟動(dòng)了一個(gè)4GB內(nèi)存的ARM64虛擬機(jī),可以看到前1GB的虛擬地址空間大多數(shù)是PMD和PTE映射,后面的3GB,全是PUD映射:

188ac456-4e4d-11eb-8b86-12bb97331649.png

我的內(nèi)核啟動(dòng)參數(shù)加了rodata=0:

$ cat/proc/cmdlineroot=/dev/vda2 rw console=ttyAMA0 ip=dhcp rodata=0

原因是內(nèi)核在幾種情況下,是不會(huì)做這種PMD和PUD映射的,相關(guān)代碼見于:

18d0ee68-4e4d-11eb-8b86-12bb97331649.png

191e8b00-4e4d-11eb-8b86-12bb97331649.png

rodata_full在默認(rèn)情況下總是成立的,它對(duì)應(yīng)著內(nèi)核的一個(gè)Config選項(xiàng)CONFIG_RODATA_FULL_DEFAULT_ENABLED, "Apply r/o permissions of VM areas also to their linear aliases",這個(gè)選項(xiàng)提高了內(nèi)核的安全性,但是減小了內(nèi)核的性能。

197a2640-4e4d-11eb-8b86-12bb97331649.png

我在內(nèi)核啟動(dòng)參數(shù)加的rodata=0實(shí)際上是讓rodata_full為false。如果我把這個(gè)kernel啟動(dòng)選項(xiàng)去掉,我得到的內(nèi)核頁表是完全不一樣,線性映射區(qū)也全部是PTE映射:

199d2ee2-4e4d-11eb-8b86-12bb97331649.png

最后,值得一提的是,不僅線性映射區(qū)可以使用PMD映射,vmemmap映射區(qū)也是在4K頁面情況下,默認(rèn)用PMD映射的:

1a0676fe-4e4d-11eb-8b86-12bb97331649.png

字節(jié)跳動(dòng)的宋牧春童鞋發(fā)了一個(gè)patchset,企圖在用戶分得巨頁的情況下,刪除巨頁內(nèi)部的4KB的小page占用的page struct的內(nèi)存消耗,這個(gè)patchset在圣誕節(jié)前目前發(fā)到了V11:

https://lore.kernel.org/linux-mm/20201222142440.28930-1-songmuchun@bytedance.com/

1a6a8f18-4e4d-11eb-8b86-12bb97331649.png

在這個(gè)patchset中,它就需要拆分vmemmap的PMD映射為PTE映射:

1b367c4a-4e4d-11eb-8b86-12bb97331649.png

這個(gè)patchset的原理建立在,當(dāng)內(nèi)核以4KB分頁的時(shí)候,每個(gè)page需要64字節(jié)的page struct。但是,當(dāng)用戶把它分配為巨頁的時(shí)候,時(shí)候,我們不再需要一個(gè)個(gè)4KB單獨(dú)用page struct描述,對(duì)于這種compound page的情況,我們應(yīng)該可以把后面的page struct的內(nèi)存直接釋放掉,因?yàn)榍闆r完全是雷同的,這樣可以剩下不少內(nèi)存。

責(zé)任編輯:xj

原文標(biāo)題:宋寶華: ARM64 Linux內(nèi)核頁表的塊映射

文章出處:【微信公眾號(hào):Linuxer】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • ARM
    ARM
    +關(guān)注

    關(guān)注

    135

    文章

    9589

    瀏覽量

    393810
  • 內(nèi)核
    +關(guān)注

    關(guān)注

    4

    文章

    1476

    瀏覽量

    43099
  • Linux
    +關(guān)注

    關(guān)注

    88

    文章

    11822

    瀏覽量

    219604
  • 板塊
    +關(guān)注

    關(guān)注

    0

    文章

    4

    瀏覽量

    7698

原文標(biāo)題:宋寶華: ARM64 Linux內(nèi)核頁表的塊映射

文章出處:【微信號(hào):LinuxDev,微信公眾號(hào):Linux閱碼場(chǎng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    如何在 Linux 中使用 imx8mm

    /linux/v6.11/source/arch/arm64/boot/dts/freescale/imx8mm.dtsi) 定義了所有四個(gè) A53 內(nèi)核。 現(xiàn)在我們的硬件部門詢問他們是否可以簡(jiǎn)單地將
    發(fā)表于 04-29 08:26

    Linux Kernel 6.1 tools目錄全解析?| RK平臺(tái)ARM64交叉編譯實(shí)戰(zhàn)指南

    ? 在瑞芯微( RK ) ARM64 平臺(tái)嵌入式 Linux 開發(fā)、內(nèi)核調(diào)試與硬件外設(shè)測(cè)試中, Linux 內(nèi)核源碼自帶的 tools 目錄
    的頭像 發(fā)表于 04-16 18:42 ?7625次閱讀
    <b class='flag-5'>Linux</b> Kernel 6.1 tools目錄全解析?| RK平臺(tái)<b class='flag-5'>ARM64</b>交叉編譯實(shí)戰(zhàn)指南

    如何理解Linux內(nèi)核中的PCIe驅(qū)動(dòng)

    我們習(xí)慣了用 Verilog 去死磕 PCIe 的底層協(xié)議狀態(tài)機(jī)。但一旦越過硬件邊界來到操作系統(tǒng)層面,Linux 內(nèi)核是如何接管并驅(qū)動(dòng)這些 PCI/PCIe 設(shè)備的呢?由于不同的 CPU 架構(gòu)實(shí)現(xiàn)了
    的頭像 發(fā)表于 04-11 17:22 ?1291次閱讀

    無法在 VF2 上運(yùn)行 aarch64 / x86_64 容器怎么處理?

    設(shè)置好 qemu 和 podman 后,我嘗試使用 --arch 運(yùn)行跨架構(gòu)容器,但遇到錯(cuò)誤: user@starfive:~$ podman run --arch arm64
    發(fā)表于 03-17 06:27

    Linux內(nèi)核驅(qū)動(dòng)開發(fā)的技術(shù)核心精要

    嵌入式Linux驅(qū)動(dòng)開發(fā)是連接硬件與操作系統(tǒng)的關(guān)鍵環(huán)節(jié)。隨著內(nèi)核演進(jìn)(如Linux 6.13)和硬件復(fù)雜度提升,開發(fā)者需掌握并發(fā)控制、中斷分層、內(nèi)存管理、設(shè)備樹、調(diào)試工具等核心知識(shí)。本文提煉出驅(qū)動(dòng)
    發(fā)表于 03-10 13:56

    從架構(gòu)到驅(qū)動(dòng):這三本經(jīng)典書,承包了我的嵌入式Linux入門與進(jìn)階

    作為一個(gè)深耕嵌入式領(lǐng)域的開發(fā)者,書架上總有幾本“壓箱底” 的書 —— 它們既是新手入門的燈塔,也是老手復(fù)盤的手冊(cè)。今天想和大家聊聊幾本經(jīng)典的書,《ARM64 體系結(jié)構(gòu)編程與實(shí)踐》《鳥哥的 Linux
    的頭像 發(fā)表于 02-09 17:02 ?1388次閱讀

    深入剖析ARM64內(nèi)核關(guān)鍵文件:kernel-6.1/arch/arm64/kernel/head.S

    ARM64 架構(gòu)的 Linux 內(nèi)核開發(fā)中,arch/arm64/kernel/head.S是一個(gè)繞不開的關(guān)鍵文件—— 它是內(nèi)核啟動(dòng)早期
    的頭像 發(fā)表于 02-04 17:35 ?1411次閱讀
    深入剖析<b class='flag-5'>ARM64</b><b class='flag-5'>內(nèi)核</b>關(guān)鍵文件:kernel-6.1/arch/<b class='flag-5'>arm64</b>/kernel/head.S

    深入RK3588內(nèi)核:rockchip_linux_defconfig的作用與調(diào)試價(jià)值

    在 RK3588 芯片的 Linux 開發(fā)中,有一個(gè)文件始終是開發(fā)者繞不開的核心 ——kernel/arch/arm64/configs/rockchip_linux_defconfig。無論是首次
    的頭像 發(fā)表于 02-03 15:56 ?1399次閱讀
    深入RK3588<b class='flag-5'>內(nèi)核</b>:rockchip_<b class='flag-5'>linux</b>_defconfig的作用與調(diào)試價(jià)值

    調(diào)試RK3588必看!這個(gè)臨時(shí)設(shè)備樹文件,藏著你要的所有配置答案

    做RK3588 芯片開發(fā)的小伙伴,肯定在kernel/arch/arm64/boot/dts/rockchip/目錄下見過一個(gè)“長(zhǎng)名字文件
    的頭像 發(fā)表于 02-03 15:55 ?1623次閱讀
    調(diào)試RK3588必看!這個(gè)臨時(shí)設(shè)備樹文件,藏著你要的所有配置答案

    【「Linux 設(shè)備驅(qū)動(dòng)開發(fā)(第 2 版)」閱讀體驗(yàn)】+讀深入理解Linux內(nèi)核內(nèi)存分配

    ,目前4KB是廣泛使用的大小。在Linux操作系統(tǒng)中,每個(gè)進(jìn)程甚至內(nèi)核本身都被分配了地址空間,這是處理器的虛擬地址空間的一部分,內(nèi)核和進(jìn)程都不處理物理地址,物理地址由MMU處理。 虛
    發(fā)表于 01-16 20:05

    深入剖析ARM64異常處理:開發(fā)者必須掌握的底層核心邏輯

    ARM64架構(gòu)的開發(fā)領(lǐng)域,異常處理絕非單純的理論知識(shí)點(diǎn),而是直接決定系統(tǒng)穩(wěn)定性、調(diào)試效率和功能實(shí)現(xiàn)的關(guān)鍵技術(shù)。無論是嵌入式開發(fā)、Linux內(nèi)核移植,還是驅(qū)動(dòng)開發(fā)與芯片調(diào)試,理解異常發(fā)生后CPU
    的頭像 發(fā)表于 12-24 07:05 ?1386次閱讀
    深入剖析<b class='flag-5'>ARM64</b>異常處理:開發(fā)者必須掌握的底層核心邏輯

    Linux內(nèi)核模塊的加載機(jī)制

    \"GPL\") bool sig_ok;// 簽名驗(yàn)證結(jié)果 };然后進(jìn)行內(nèi)存分配 1、使用vmalloc()在內(nèi)核空間分配內(nèi)存,映射模塊的代碼和數(shù)據(jù)段。 2、標(biāo)記可執(zhí)行(需
    發(fā)表于 11-25 06:59

    【米爾NXP i.MX 91開發(fā)板評(píng)測(cè)】移植和運(yùn)行RT-Linux,實(shí)時(shí)性能測(cè)試

    CONFIG_PREEMPT_RT make olddefconfig echo \"編譯內(nèi)核和模塊...\" make -j$(nproc) ARCH=arm64
    發(fā)表于 09-01 10:11

    【HZ-RK3568開發(fā)板免費(fèi)體驗(yàn)】HZ-RK3568開發(fā)板操作系統(tǒng)編譯

    RK_KERNEL_CFG=rockchip_linux_defconfig RK_KERNEL_DTB=kernel/arch/arm64/boot/dts/rockchip
    發(fā)表于 08-17 09:15

    【HZ-RK3568開發(fā)板免費(fèi)體驗(yàn)】3、開啟Linux Kernel RT功能

    /aarch64-none-linux-gnu- make ARCH=arm64 rockchip_linux_defconfig rockchip_rt.config make -C /path/to/SDK/kernel
    發(fā)表于 07-22 14:03
    平舆县| 密山市| 元江| 泰宁县| 涿鹿县| 通道| 武宣县| 郎溪县| 贵溪市| 游戏| 商水县| 台东市| 常州市| 连平县| 米泉市| 专栏| 武邑县| 乌拉特中旗| 富锦市| 吴江市| 嘉定区| 明星| 乌审旗| 宁武县| 金湖县| 河东区| 盐池县| 海南省| 五大连池市| 柳河县| 当雄县| 和平县| 宁城县| 龙门县| 白沙| 鄂托克旗| 两当县| 承德县| 晋中市| 壶关县| 海晏县|