您好,登錄后才能下訂單哦!
這篇文章主要介紹Linux內(nèi)核內(nèi)存管理架構(gòu)的示例分析,文中介紹的非常詳細(xì),具有一定的參考價值,感興趣的小伙伴們一定要看完!
內(nèi)存管理硬件架構(gòu)
因?yàn)閮?nèi)存管理是內(nèi)核最為核心的一個功能,針對內(nèi)存管理性能優(yōu)化,除了軟件優(yōu)化,硬件架構(gòu)也做了很多的優(yōu)化設(shè)計(jì)。下圖是一個目前主流處理器上的存儲器層次結(jié)構(gòu)設(shè)計(jì)方案。
從圖中可以看出,對于讀寫內(nèi)存,硬件設(shè)計(jì)了3條優(yōu)化路徑。
1)首先L1 cache支持虛擬地址尋址,保證CPU出來的虛擬地址(VA)不需要轉(zhuǎn)換成物理地址(PA)就可以用來直接查找L1 cache,提高cache查找效率。當(dāng)然用VA查找cache,有安全等缺陷,這需要CPU做一些特別的設(shè)計(jì)來進(jìn)行彌補(bǔ),具體可以閱讀《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》了解相關(guān)細(xì)節(jié)。
2)如果L1 cache沒有命中,這就需要進(jìn)行地址轉(zhuǎn)換,把VA轉(zhuǎn)換成PA。linux的內(nèi)存映射管理是通過頁表來實(shí)現(xiàn)的,但是頁表是放在內(nèi)存中的,如果每次地址轉(zhuǎn)換過程都需要訪問一次內(nèi)存,其效率是十分低下的。這里CPU通過TLB硬件單元來加速地址轉(zhuǎn)換。
3)獲得PA后,在L2 cache中再查找緩存數(shù)據(jù)。L2 cache一般比L1 cache大一個數(shù)量級,其查找命中率也更高。如果命中獲得數(shù)據(jù),則可避免去訪問內(nèi)存,提高訪問效率。
可見,為了優(yōu)化內(nèi)存訪問效率,現(xiàn)代處理器引入多級cache、TLB等硬件模塊(如下圖是一款8核MIPS處理器硬件框圖)。每個硬件模塊內(nèi)部還有大量的設(shè)計(jì)細(xì)節(jié),這里不再深入,如有興趣可以閱讀《計(jì)算機(jī)體系結(jié)構(gòu):量化研究方法》等書籍進(jìn)一步了解。
內(nèi)存映射空間劃分
根據(jù)不同的內(nèi)存使用方式和使用場景需要,內(nèi)核把內(nèi)存映射地址空間劃分成多個部分,每個劃分空間都有自己的起止地址、分配接口和使用場景。下圖是一個常見的32位地址空間劃分結(jié)構(gòu)。
DMA內(nèi)存動態(tài)分配地址空間:一些DMA設(shè)備因?yàn)槠渥陨韺ぶ纺芰Φ南拗疲荒茉L問所有內(nèi)存空間。如早期的ISA設(shè)備只能在24位地址空間執(zhí)行DMA,即只能訪問前16MB內(nèi)存。所以需要劃分出DMA內(nèi)存動態(tài)分配空間,即DMA zone。其分配通過加上GFP_ATOMIC控制符的kmalloc接口來申請。
直接內(nèi)存動態(tài)分配地址空間:因?yàn)樵L問效率等原因,內(nèi)核對內(nèi)存采用簡單的線性映射,但是因?yàn)?2位CPU的尋址能力(4G大?。┖蛢?nèi)核地址空間起始的設(shè)置(3G開始),會導(dǎo)致內(nèi)核的地址空間資源不足,當(dāng)內(nèi)存大于1GB時,就無法直接映射所有內(nèi)存。無法直接映射的地址空間部分,即highmem zone。在DMA zone和highmem zone中間的區(qū)域即normal zone,主要用于內(nèi)核的動態(tài)內(nèi)存分配。其分配通過kmalloc接口來申請。
高端內(nèi)存動態(tài)分配地址空間:高端內(nèi)存分配的內(nèi)存是虛擬地址連續(xù)而物理地址不連續(xù)的內(nèi)存,一般用于內(nèi)核動態(tài)加載的模塊和驅(qū)動,因?yàn)閮?nèi)核可能運(yùn)行了很久,內(nèi)存頁面碎片情況嚴(yán)重,如果要申請大的連續(xù)地址的內(nèi)存頁會比較困難,容易導(dǎo)致分配失敗。根據(jù)應(yīng)用需要,高端內(nèi)存分配提供多個接口:
vmalloc:指定分配大小,page位置和虛擬地址隱式分配;
vmap:指定page位置數(shù)組,虛擬地址隱式分配;
ioremap:指定物理地址和大小,虛擬地址隱式分配。
持久映射地址空間:內(nèi)核上下文切換會伴隨著TLB刷新,這會導(dǎo)致性能下降。但一些使用高端內(nèi)存的模塊對性能也有很高要求。持久映射空間在內(nèi)核上下文切換時,其TLB不刷新,所以它們映射的高端地址空間尋址效率較高。其分配通過kmap接口來申請。kmap與vmap的區(qū)別是:vmap可以映射一組page,即page不連續(xù),但虛擬地址連續(xù),而kmap只能映射一個page到虛擬地址空間。kmap主要用于fs、net等對高端內(nèi)存訪問有較高性能要求的模塊中。
固定映射地址空間:持久映射的問題是可能會休眠,在中斷上下文、自旋鎖臨界區(qū)等不能阻塞的場景中不可用。為了解決這個問題,內(nèi)核又劃分出固定映射,其接口不會休眠。固定映射空間通過kmap_atomic接口來映射。kmap_atomic的使用場景與kmap較為相似,主要用于mm、fs、net等對高端內(nèi)存訪問有較高性能要求而且不能休眠的模塊中。
不同的CPU體系架構(gòu)在地址空間劃分上不盡相同,但為了保證CPU體系差異對外部模塊不可見,內(nèi)存地址空間的分配接口的語義是一致的。
因?yàn)?4位CPU一般都不需要高端內(nèi)存(當(dāng)然也可以支持),在地址空間劃分上與32位CPU的差異較大,下圖是一個MIPS64 CPU的內(nèi)核地址空間劃分圖。
內(nèi)存管理軟件架構(gòu)
內(nèi)核內(nèi)存管理的核心工作就是內(nèi)存的分配回收管理,其內(nèi)部分為2個體系:頁管理和對象管理。頁管理體系是一個兩級的層次結(jié)構(gòu),對象管理體系是一個三級的層次結(jié)構(gòu),分配成本和操作對CPU cache和TLB的負(fù)面影響,從上而下逐漸升高。
頁管理層次結(jié)構(gòu):由冷熱緩存、伙伴系統(tǒng)組成的兩級結(jié)構(gòu)。負(fù)責(zé)內(nèi)存頁的緩存、分配、回收。
對象管理層次結(jié)構(gòu):由per-cpu高速緩存、slab緩存、伙伴系統(tǒng)組成的三級結(jié)構(gòu)。負(fù)責(zé)對象的緩存、分配、回收。這里的對象指小于一頁大小的內(nèi)存塊。
除了內(nèi)存分配,內(nèi)存釋放也是按照此層次結(jié)構(gòu)操作。如釋放對象,先釋放到per-cpu緩存,再釋放到slab緩存,最后再釋放到伙伴系統(tǒng)。
框圖中有三個主要模塊,即伙伴系統(tǒng)、slab分配器和per-cpu(冷熱)緩存。他們的對比分析如下。
以上是“Linux內(nèi)核內(nèi)存管理架構(gòu)的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對大家有幫助,更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。