溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

Linux是怎么管理內(nèi)存的

發(fā)布時(shí)間：2021-08-05 20:41:55 來源：億速云閱讀：155 作者：chen 欄目：系統(tǒng)運(yùn)維

本篇內(nèi)容介紹了“Linux是怎么管理內(nèi)存的”的有關(guān)知識，在實(shí)際案例的操作過程中，不少人都會遇到這樣的困境，接下來就讓小編帶領(lǐng)大家學(xué)習(xí)一下如何處理這些情況吧！希望大家仔細(xì)閱讀，能夠?qū)W有所成！

基本概念

每個(gè) Linux 進(jìn)程都會有地址空間，這些地址空間由三個(gè)段區(qū)域組成：text 段、data 段、stack 段。下面是進(jìn)程地址空間的示例。

Linux是怎么管理內(nèi)存的

數(shù)據(jù)段(data segment) 包含了程序的變量、字符串、數(shù)組和其他數(shù)據(jù)的存儲。數(shù)據(jù)段分為兩部分，已經(jīng)初始化的數(shù)據(jù)和尚未初始化的數(shù)據(jù)。其中尚未初始化的數(shù)據(jù)就是我們說的 BSS。數(shù)據(jù)段部分的初始化需要編譯就期確定的常量以及程序啟動就需要一個(gè)初始值的變量。所有 BSS 部分中的變量在加載后被初始化為 0 。

和代碼段(Text segment) 不一樣，data segment 數(shù)據(jù)段可以改變。程序總是修改它的變量。而且，許多程序需要在執(zhí)行時(shí)動態(tài)分配空間。Linux 允許數(shù)據(jù)段隨著內(nèi)存的分配和回收從而增大或者減小。為了分配內(nèi)存，程序可以增加數(shù)據(jù)段的大小。在 C 語言中有一套標(biāo)準(zhǔn)庫 malloc經(jīng)常用于分配內(nèi)存。進(jìn)程地址空間描述符包含動態(tài)分配的內(nèi)存區(qū)域稱為堆(heap)。

第三部分段是棧段(stack segment)。在大部分機(jī)器上，棧段會在虛擬內(nèi)存地址頂部地址位置處，并向低位置處(向地址空間為 0 處)拓展。舉個(gè)例子來說，在 32 位 x86 架構(gòu)的機(jī)器上，棧開始于 0xC0000000，這是用戶模式下進(jìn)程允許可見的 3GB 虛擬地址限制。如果棧一直增大到超過棧段后，就會發(fā)生硬件故障并把頁面下降一個(gè)頁面。

當(dāng)程序啟動時(shí)，棧區(qū)域并不是空的，相反，它會包含所有的 shell 環(huán)境變量以及為了調(diào)用它而向 shell 輸入的命令行。舉個(gè)例子，當(dāng)你輸入

cp cxuan lx

時(shí)，cp 程序會運(yùn)行并在棧中帶著字符串 cp cxuan lx ，這樣就能夠找出源文件和目標(biāo)文件的名稱。

當(dāng)兩個(gè)用戶運(yùn)行在相同程序中，例如編輯器(editor)，那么就會在內(nèi)存中保持編輯器程序代碼的兩個(gè)副本，但是這種方式并不高效。Linux 系統(tǒng)支持共享文本段作為替代。下面圖中我們會看到 A 和 B 兩個(gè)進(jìn)程，它們有著相同的文本區(qū)域。

Linux是怎么管理內(nèi)存的

數(shù)據(jù)段和棧段只有在 fork 之后才會共享，共享也是共享未修改過的頁面。如果任何一個(gè)都需要變大但是沒有相鄰空間容納的話，也不會有問題，因?yàn)橄噜彽奶摂M頁面不必映射到相鄰的物理頁面上。

除了動態(tài)分配更多的內(nèi)存，Linux 中的進(jìn)程可以通過內(nèi)存映射文件來訪問文件數(shù)據(jù)。這個(gè)特性可以使我們把一個(gè)文件映射到進(jìn)程空間的一部分而該文件就可以像位于內(nèi)存中的字節(jié)數(shù)組一樣被讀寫。把一個(gè)文件映射進(jìn)來使得隨機(jī)讀寫比使用 read 和 write 之類的 I/O 系統(tǒng)調(diào)用要容易得多。共享庫的訪問就是使用了這種機(jī)制。如下所示

Linux是怎么管理內(nèi)存的

我們可以看到兩個(gè)相同文件會被映射到相同的物理地址上，但是它們屬于不同的地址空間。

映射文件的優(yōu)點(diǎn)是，兩個(gè)或多個(gè)進(jìn)程可以同時(shí)映射到同一文件中，任意一個(gè)進(jìn)程對文件的寫操作對其他文件可見。通過使用映射臨時(shí)文件的方式，可以為多線程共享內(nèi)存提供高帶寬，臨時(shí)文件在進(jìn)程退出后消失。但是實(shí)際上，并沒有兩個(gè)相同的地址空間，因?yàn)槊總€(gè)進(jìn)程維護(hù)的打開文件和信號不同。

Linux 內(nèi)存管理系統(tǒng)調(diào)用下面我們探討一下關(guān)于內(nèi)存管理的系統(tǒng)調(diào)用方式。事實(shí)上，POSIX 并沒有給內(nèi)存管理指定任何的系統(tǒng)調(diào)用。然而，Linux 卻有自己的內(nèi)存系統(tǒng)調(diào)用，主要系統(tǒng)調(diào)用如下

Linux是怎么管理內(nèi)存的

如果遇到錯誤，那么 s 的返回值是 -1，a 和 addr 是內(nèi)存地址，len 表示的是長度，prot 表示的是控制保護(hù)位，flags 是其他標(biāo)志位，fd 是文件描述符，offset 是文件偏移量。

brk 通過給出超過數(shù)據(jù)段之外的第一個(gè)字節(jié)地址來指定數(shù)據(jù)段的大小。如果新的值要比原來的大，那么數(shù)據(jù)區(qū)會變得越來越大，反之會越來越小。

mmap 和 unmap 系統(tǒng)調(diào)用會控制映射文件。mmp 的第一個(gè)參數(shù) addr 決定了文件映射的地址。它必須是頁面大小的倍數(shù)。如果參數(shù)是 0，系統(tǒng)會分配地址并返回 a。第二個(gè)參數(shù)是長度，它告訴了需要映射多少字節(jié)。它也是頁面大小的倍數(shù)。prot 決定了映射文件的保護(hù)位，保護(hù)位可以標(biāo)記為可讀、可寫、可執(zhí)行或者這些的結(jié)合。第四個(gè)參數(shù) flags 能夠控制文件是私有的還是可讀的以及 addr 是必須的還是只是進(jìn)行提示。第五個(gè)參數(shù) fd 是要映射的文件描述符。只有打開的文件是可以被映射的，因此如果想要進(jìn)行文件映射，必須打開文件;最后一個(gè)參數(shù) offset 會指示文件從什么時(shí)候開始，并不一定每次都要從零開始。

Linux 內(nèi)存管理實(shí)現(xiàn)內(nèi)存管理系統(tǒng)是操作系統(tǒng)最重要的部分之一。從計(jì)算機(jī)早期開始，我們實(shí)際使用的內(nèi)存都要比系統(tǒng)中實(shí)際存在的內(nèi)存多。內(nèi)存分配策略克服了這一限制，并且其中最有名的就是虛擬內(nèi)存(virtual memory)。通過在多個(gè)競爭的進(jìn)程之間共享虛擬內(nèi)存，虛擬內(nèi)存得以讓系統(tǒng)有更多的內(nèi)存。虛擬內(nèi)存子系統(tǒng)主要包括下面這些概念。

大地址空間

操作系統(tǒng)使系統(tǒng)使用起來好像比實(shí)際的物理內(nèi)存要大很多，那是因?yàn)樘摂M內(nèi)存要比物理內(nèi)存大很多倍。

保護(hù)

系統(tǒng)中的每個(gè)進(jìn)程都會有自己的虛擬地址空間。這些虛擬地址空間彼此完全分開，因此運(yùn)行一個(gè)應(yīng)用程序的進(jìn)程不會影響另一個(gè)。并且，硬件虛擬內(nèi)存機(jī)制允許內(nèi)存保護(hù)關(guān)鍵內(nèi)存區(qū)域。

內(nèi)存映射

內(nèi)存映射用來向進(jìn)程地址空間映射圖像和數(shù)據(jù)文件。在內(nèi)存映射中，文件的內(nèi)容直接映射到進(jìn)程的虛擬空間中。

公平的物理內(nèi)存分配

內(nèi)存管理子系統(tǒng)允許系統(tǒng)中的每個(gè)正在運(yùn)行的進(jìn)程公平分配系統(tǒng)的物理內(nèi)存。

共享虛擬內(nèi)存

盡管虛擬內(nèi)存讓進(jìn)程有自己的內(nèi)存空間，但是有的時(shí)候你是需要共享內(nèi)存的。例如幾個(gè)進(jìn)程同時(shí)在 shell 中運(yùn)行，這會涉及到 IPC 的進(jìn)程間通信問題，這個(gè)時(shí)候你需要的是共享內(nèi)存來進(jìn)行信息傳遞而不是通過拷貝每個(gè)進(jìn)程的副本獨(dú)立運(yùn)行。

下面我們就正式探討一下什么是虛擬內(nèi)存

虛擬內(nèi)存的抽象模型

在考慮 Linux 用于支持虛擬內(nèi)存的方法之前，考慮一個(gè)不會被太多細(xì)節(jié)困擾的抽象模型是很有用的。

處理器在執(zhí)行指令時(shí)，會從內(nèi)存中讀取指令并將其解碼(decode)，在指令解碼時(shí)會獲取某個(gè)位置的內(nèi)容并將他存到內(nèi)存中。然后處理器繼續(xù)執(zhí)行下一條指令。這樣，處理器總是在訪問存儲器以獲取指令和存儲數(shù)據(jù)。

在虛擬內(nèi)存系統(tǒng)中，所有的地址空間都是虛擬的而不是物理的。但是實(shí)際存儲和提取指令的是物理地址，所以需要讓處理器根據(jù)操作系統(tǒng)維護(hù)的一張表將虛擬地址轉(zhuǎn)換為物理地址。

為了簡單的完成轉(zhuǎn)換，虛擬地址和物理地址會被分為固定大小的塊，稱為頁(page)。這些頁有相同大小，如果頁面大小不一樣的話，那么操作系統(tǒng)將很難管理。Alpha AXP系統(tǒng)上的 Linux 使用 8 KB 頁面，而 Intel x86 系統(tǒng)上的 Linux 使用 4 KB 頁面。每個(gè)頁面都有一個(gè)唯一的編號，即頁面框架號(PFN)。

Linux是怎么管理內(nèi)存的

上面就是 Linux 內(nèi)存映射模型了，在這個(gè)頁模型中，虛擬地址由兩部分組成：偏移量和虛擬頁框號。每次處理器遇到虛擬地址時(shí)都會提取偏移量和虛擬頁框號。處理器必須將虛擬頁框號轉(zhuǎn)換為物理頁號，然后以正確的偏移量的位置訪問物理頁。

上圖中展示了兩個(gè)進(jìn)程 A 和 B 的虛擬地址空間，每個(gè)進(jìn)程都有自己的頁表。這些頁表將進(jìn)程中的虛擬頁映射到內(nèi)存中的物理頁中。頁表中每一項(xiàng)均包含

有效標(biāo)志(valid flag)：表明此頁表?xiàng)l目是否有效
該條目描述的物理頁框號
訪問控制信息，頁面使用方式，是否可寫以及是否可以執(zhí)行代碼

要將處理器的虛擬地址映射為內(nèi)存的物理地址，首先需要計(jì)算虛擬地址的頁框號和偏移量。頁面大小為 2 的次冪，可以通過移位完成操作。

如果當(dāng)前進(jìn)程嘗試訪問虛擬地址，但是訪問不到的話，這種情況稱為缺頁異常，此時(shí)虛擬操作系統(tǒng)的錯誤地址和頁面錯誤的原因?qū)⑼ㄖ僮飨到y(tǒng)。

通過以這種方式將虛擬地址映射到物理地址，虛擬內(nèi)存可以以任何順序映射到系統(tǒng)的物理頁面。

按需分頁

由于物理內(nèi)存要比虛擬內(nèi)存少很多，因此操作系統(tǒng)需要注意盡量避免直接使用低效的物理內(nèi)存。節(jié)省物理內(nèi)存的一種方式是僅加載執(zhí)行程序當(dāng)前使用的頁面(這何嘗不是一種懶加載的思想呢?)。例如，可以運(yùn)行數(shù)據(jù)庫來查詢數(shù)據(jù)庫，在這種情況下，不是所有的數(shù)據(jù)都裝入內(nèi)存，只裝載需要檢查的數(shù)據(jù)。這種僅僅在需要時(shí)才將虛擬頁面加載進(jìn)內(nèi)中的技術(shù)稱為按需分頁。

交換

如果某個(gè)進(jìn)程需要將虛擬頁面?zhèn)魅雰?nèi)存，但是此時(shí)沒有可用的物理頁面，那么操作系統(tǒng)必須丟棄物理內(nèi)存中的另一個(gè)頁面來為該頁面騰出空間。

如果頁面已經(jīng)修改過，那么操作系統(tǒng)必須保留該頁面的內(nèi)容，以便以后可以訪問它。這種類型的頁面被稱為臟頁，當(dāng)將其從內(nèi)存中移除時(shí)，它會保存在稱為交換文件的特殊文件中。相對于處理器和物理內(nèi)存的速度，對交換文件的訪問非常慢，并且操作系統(tǒng)需要兼顧將頁面寫到磁盤的以及將它們保留在內(nèi)存中以便再次使用。

Linux 使用最近最少使用(LRU)頁面老化技術(shù)來公平的選擇可能會從系統(tǒng)中刪除的頁面，這個(gè)方案涉及系統(tǒng)中的每個(gè)頁面，頁面的年齡隨著訪問次數(shù)的變化而變化，如果某個(gè)頁面訪問次數(shù)多，那么該頁就表示越年輕，如果某個(gè)呃頁面訪問次數(shù)太少，那么該頁越容易被換出。

物理和虛擬尋址模式

大多數(shù)多功能處理器都支持物理地址模式和虛擬地址模式的概念。物理尋址模式不需要頁表，并且處理器不會在此模式下嘗試執(zhí)行任何地址轉(zhuǎn)換。Linux 內(nèi)核被鏈接在物理地址空間中運(yùn)行。

Alpha AXP 處理器沒有物理尋址模式。相反，它將內(nèi)存空間劃分為幾個(gè)區(qū)域，并將其中兩個(gè)指定為物理映射的地址。此內(nèi)核地址空間稱為 KSEG 地址空間，它包含從 0xfffffc0000000000 向上的所有地址。為了從 KSEG 中鏈接的代碼(按照定義，內(nèi)核代碼)執(zhí)行或訪問其中的數(shù)據(jù)，該代碼必須在內(nèi)核模式下執(zhí)行。鏈接到 Alpha 上的 Linux內(nèi)核以從地址 0xfffffc0000310000 執(zhí)行。

訪問控制

頁面表的每一項(xiàng)還包含訪問控制信息，訪問控制信息主要檢查進(jìn)程是否應(yīng)該訪問內(nèi)存。

必要時(shí)需要對內(nèi)存進(jìn)行訪問限制。例如包含可執(zhí)行代碼的內(nèi)存，自然是只讀內(nèi)存;操作系統(tǒng)不應(yīng)允許進(jìn)程通過其可執(zhí)行代碼寫入數(shù)據(jù)。相比之下，包含數(shù)據(jù)的頁面可以被寫入，但是嘗試執(zhí)行該內(nèi)存的指令將失敗。大多數(shù)處理器至少具有兩種執(zhí)行模式：內(nèi)核態(tài)和用戶態(tài)。你不希望訪問用戶執(zhí)行內(nèi)核代碼或內(nèi)核數(shù)據(jù)結(jié)構(gòu)，除非處理器以內(nèi)核模式運(yùn)行。

Linux是怎么管理內(nèi)存的

訪問控制信息被保存在上面的 Page Table Entry ，頁表項(xiàng)中，上面這幅圖是 Alpha AXP的 PTE。位字段具有以下含義

V

表示 valid ，是否有效位

FOR

讀取時(shí)故障，在嘗試讀取此頁面時(shí)出現(xiàn)故障

FOW

寫入時(shí)錯誤，在嘗試寫入時(shí)發(fā)生錯誤

FOE

執(zhí)行時(shí)發(fā)生錯誤，在嘗試執(zhí)行此頁面中的指令時(shí)，處理器都會報(bào)告頁面錯誤并將控制權(quán)傳遞給操作系統(tǒng)，

ASM

地址空間匹配，當(dāng)操作系統(tǒng)希望清除轉(zhuǎn)換緩沖區(qū)中的某些條目時(shí)，將使用此選項(xiàng)。

GH

當(dāng)在使用單個(gè)轉(zhuǎn)換緩沖區(qū)條目而不是多個(gè)轉(zhuǎn)換緩沖區(qū)條目映射整個(gè)塊時(shí)使用的提示。

KRE

內(nèi)核模式運(yùn)行下的代碼可以讀取頁面

URE

用戶模式下的代碼可以讀取頁面

KWE

以內(nèi)核模式運(yùn)行的代碼可以寫入頁面

UWE

以用戶模式運(yùn)行的代碼可以寫入頁面

頁框號

對于設(shè)置了 V 位的 PTE，此字段包含此 PTE 的物理頁面幀號(頁面幀號)。對于無效的 PTE，如果此字段不為零，則包含有關(guān)頁面在交換文件中的位置的信息。

除此之外，Linux 還使用了兩個(gè)位

_PAGE_DIRTY

如果已設(shè)置，則需要將頁面寫出到交換文件中

_PAGE_ACCESSED

Linux 用來將頁面標(biāo)記為已訪問。

緩存

上面的虛擬內(nèi)存抽象模型可以用來實(shí)施，但是效率不會太高。操作系統(tǒng)和處理器設(shè)計(jì)人員都嘗試提高性能。但是除了提高處理器，內(nèi)存等的速度之外，最好的方法就是維護(hù)有用信息和數(shù)據(jù)的高速緩存，從而使某些操作更快。在 Linux 中，使用很多和內(nèi)存管理有關(guān)的緩沖區(qū)，使用緩沖區(qū)來提高效率。

緩沖區(qū)緩存

緩沖區(qū)高速緩存包含塊設(shè)備驅(qū)動程序使用的數(shù)據(jù)緩沖區(qū)。

還記得什么是塊設(shè)備么?這里回顧下

塊設(shè)備是一個(gè)能存儲固定大小塊信息的設(shè)備，它支持以固定大小的塊，扇區(qū)或群集讀取和(可選)寫入數(shù)據(jù)。每個(gè)塊都有自己的物理地址。通常塊的大小在 512 - 65536 之間。所有傳輸?shù)男畔⒍紩赃B續(xù)的塊為單位。塊設(shè)備的基本特征是每個(gè)塊都較為對立，能夠獨(dú)立的進(jìn)行讀寫。常見的塊設(shè)備有硬盤、藍(lán)光光盤、USB 盤

與字符設(shè)備相比，塊設(shè)備通常需要較少的引腳。

Linux是怎么管理內(nèi)存的

緩沖區(qū)高速緩存通過設(shè)備標(biāo)識符和塊編號用于快速查找數(shù)據(jù)塊。如果可以在緩沖區(qū)高速緩存中找到數(shù)據(jù)，則無需從物理塊設(shè)備中讀取數(shù)據(jù)，這種訪問方式要快得多。

頁緩存

頁緩存用于加快對磁盤上圖像和數(shù)據(jù)的訪問

它用于一次一頁地緩存文件中的內(nèi)容，并且可以通過文件和文件中的偏移量進(jìn)行訪問。當(dāng)頁面從磁盤讀入內(nèi)存時(shí)，它們被緩存在頁面緩存中。

交換區(qū)緩存

僅僅已修改(臟頁)被保存在交換文件中

只要這些頁面在寫入交換文件后沒有修改，則下次交換該頁面時(shí)，無需將其寫入交換文件，因?yàn)樵擁撁嬉言诮粨Q文件中?？梢灾苯觼G棄。在大量交換的系統(tǒng)中，這節(jié)省了許多不必要的和昂貴的磁盤操作。

硬件緩存

處理器中通常使用一種硬件緩存。頁表?xiàng)l目的緩存。在這種情況下，處理器并不總是直接讀取頁表，而是根據(jù)需要緩存頁的翻譯。這些是轉(zhuǎn)換后備緩沖區(qū) 也被稱為 TLB，包含來自系統(tǒng)中一個(gè)或多個(gè)進(jìn)程的頁表項(xiàng)的緩存副本。

引用虛擬地址后，處理器將嘗試查找匹配的 TLB 條目。如果找到，則可以將虛擬地址直接轉(zhuǎn)換為物理地址，并對數(shù)據(jù)執(zhí)行正確的操作。如果處理器找不到匹配的 TLB 條目，它通過向操作系統(tǒng)發(fā)信號通知已發(fā)生 TLB 丟失獲得操作系統(tǒng)的支持和幫助。系統(tǒng)特定的機(jī)制用于將該異常傳遞給可以修復(fù)問題的操作系統(tǒng)代碼。操作系統(tǒng)為地址映射生成一個(gè)新的 TLB 條目。清除異常后，處理器將再次嘗試轉(zhuǎn)換虛擬地址。這次能夠執(zhí)行成功。

使用緩存也存在缺點(diǎn)，為了節(jié)省精力，Linux 必須使用更多的時(shí)間和空間來維護(hù)這些緩存，并且如果緩存損壞，系統(tǒng)將會崩潰。

Linux 頁表

Linux 假定頁表分為三個(gè)級別。訪問的每個(gè)頁表都包含下一級頁表

Linux是怎么管理內(nèi)存的

圖中的 PDG 表示全局頁表，當(dāng)創(chuàng)建一個(gè)新的進(jìn)程時(shí)，都要為新進(jìn)程創(chuàng)建一個(gè)新的頁面目錄，即 PGD。

要將虛擬地址轉(zhuǎn)換為物理地址，處理器必須獲取每個(gè)級別字段的內(nèi)容，將其轉(zhuǎn)換為包含頁表的物理頁的偏移量，并讀取下一級頁表的頁框號。這樣重復(fù)三次，直到找到包含虛擬地址的物理頁面的頁框號為止。

Linux 運(yùn)行的每個(gè)平臺都必須提供翻譯宏，這些宏允許內(nèi)核遍歷特定進(jìn)程的頁表。這樣，內(nèi)核無需知道頁表?xiàng)l目的格式或它們的排列方式。

頁分配和取消分配

對系統(tǒng)中物理頁面有很多需求。例如，當(dāng)圖像加載到內(nèi)存中時(shí)，操作系統(tǒng)需要分配頁面。

系統(tǒng)中所有物理頁面均由 mem_map 數(shù)據(jù)結(jié)構(gòu)描述，這個(gè)數(shù)據(jù)結(jié)構(gòu)是 mem_map_t 的列表。它包括一些重要的屬性

count ：這是頁面的用戶數(shù)計(jì)數(shù)，當(dāng)頁面在多個(gè)進(jìn)程之間共享時(shí)，計(jì)數(shù)大于 1
age：這是描述頁面的年齡，用于確定頁面是否適合丟棄或交換
map_nr ：這是此mem_map_t描述的物理頁框號。

頁面分配代碼使用 free_area向量查找和釋放頁面，free_area 的每個(gè)元素都包含有關(guān)頁面塊的信息。

頁面分配

Linux 的頁面分配使用一種著名的伙伴算法來進(jìn)行頁面的分配和取消分配。頁面以 2 的冪為單位進(jìn)行塊分配。這就意味著它可以分配 1頁、2 頁、4頁等等，只要系統(tǒng)中有足夠可用的頁面來滿足需求就可以。判斷的標(biāo)準(zhǔn)是nr_free_pages> min_free_pages，如果滿足，就會在 free_area 中搜索所需大小的頁面塊完成分配。free_area 的每個(gè)元素都有該大小的塊的已分配頁面和空閑頁面塊的映射。

分配算法會搜索請求大小的頁面塊。如果沒有任何請求大小的頁面塊可用的話，會搜尋一個(gè)是請求大小二倍的頁面塊，然后重復(fù)，直到一直搜尋完 free_area 找到一個(gè)頁面塊為止。如果找到的頁面塊要比請求的頁面塊大，就會對找到的頁面塊進(jìn)行細(xì)分，直到找到合適的大小塊為止。

因?yàn)槊總€(gè)塊都是 2 的次冪，所以拆分過程很容易，因?yàn)槟阒恍鑼K分成兩半即可?？臻e塊在適當(dāng)?shù)年?duì)列中排隊(duì)，分配的頁面塊返回給調(diào)用者。

Linux是怎么管理內(nèi)存的

如果請求一個(gè) 2 個(gè)頁的塊，則 4 頁的第一個(gè)塊(從第 4 頁的框架開始)將被分成兩個(gè) 2 頁的塊。第一個(gè)頁面(從第 4 頁的幀開始)將作為分配的頁面返回給調(diào)用方，第二個(gè)塊(從第 6 頁的頁面開始)將作為 2 頁的空閑塊排隊(duì)到 free_area 數(shù)組的元素 1 上。

頁面取消分配

上面的這種內(nèi)存方式最造成一種后果，那就是內(nèi)存的碎片化，會將較大的空閑頁面分成較小的頁面。頁面解除分配代碼會盡可能將頁面重新組合成為更大的空閑塊。每釋放一個(gè)頁面，都會檢查相同大小的相鄰的塊，以查看是否空閑。如果是，則將其與新釋放的頁面塊組合以形成下一個(gè)頁面大小塊的新的自由頁面塊。每次將兩個(gè)頁面塊重新組合為更大的空閑頁面塊時(shí)，頁面釋放代碼就會嘗試將該頁面塊重新組合為更大的空閑頁面。通過這種方式，可用頁面的塊將盡可能多地使用內(nèi)存。

例如上圖，如果要釋放第 1 頁的頁面，則將其與已經(jīng)空閑的第 0 頁頁面框架組合在一起，并作為大小為 2頁的空閑塊排隊(duì)到 free_area 的元素 1 中

內(nèi)存映射

內(nèi)核有兩種類型的內(nèi)存映射：共享型(shared) 和私有型(private)。私有型是當(dāng)進(jìn)程為了只讀文件，而不寫文件時(shí)使用，這時(shí)，私有映射更加高效。但是，任何對私有映射頁的寫操作都會導(dǎo)致內(nèi)核停止映射該文件中的頁。所以，寫操作既不會改變磁盤上的文件，對訪問該文件的其它進(jìn)程也是不可見的。

按需分頁

一旦可執(zhí)行映像被內(nèi)存映射到虛擬內(nèi)存后，它就可以被執(zhí)行了。因?yàn)橹粚⒂诚竦拈_頭部分物理的拉入到內(nèi)存中，因此它將很快訪問物理內(nèi)存尚未存在的虛擬內(nèi)存區(qū)域。當(dāng)進(jìn)程訪問沒有有效頁表的虛擬地址時(shí)，操作系統(tǒng)會報(bào)告這項(xiàng)錯誤。

頁面錯誤描述頁面出錯的虛擬地址和引起的內(nèi)存訪問(RAM)類型。

Linux 必須找到代表發(fā)生頁面錯誤的內(nèi)存區(qū)域的 vm_area_struct 結(jié)構(gòu)。由于搜索 vm_area_struct 數(shù)據(jù)結(jié)構(gòu)對于有效處理頁面錯誤至關(guān)重要，因此它們以 AVL(Adelson-Velskii和Landis)樹結(jié)構(gòu)鏈接在一起。如果引起故障的虛擬地址沒有 vm_area_struct 結(jié)構(gòu)，則此進(jìn)程已經(jīng)訪問了非法地址，Linux 會向進(jìn)程發(fā)出 SIGSEGV 信號，如果進(jìn)程沒有用于該信號的處理程序，那么進(jìn)程將會終止。

然后，Linux 會針對此虛擬內(nèi)存區(qū)域所允許的訪問類型，檢查發(fā)生的頁面錯誤類型。如果該進(jìn)程以非法方式訪問內(nèi)存，例如寫入僅允許讀的區(qū)域，則還會發(fā)出內(nèi)存訪問錯誤信號。

現(xiàn)在，Linux 已確定頁面錯誤是合法的，因此必須對其進(jìn)行處理。

“Linux是怎么管理內(nèi)存的”的內(nèi)容就介紹到這里了，感謝大家的閱讀。如果想了解更多行業(yè)相關(guān)的知識可以關(guān)注億速云網(wǎng)站，小編將為大家輸出更多高質(zhì)量的實(shí)用文章！

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
Jquery Ajax請求文件下載操作失敗的原因以及解決方案
下一篇新聞：
如何解決某些HTML字符打不出來的問題

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼