溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何配置Devyn的Linux內(nèi)核

發(fā)布時間:2021-09-27 15:24:00 來源:億速云 閱讀:136 作者:柒染 欄目:系統(tǒng)運維

這篇文章將為大家詳細講解有關如何配置Devyn的Linux內(nèi)核,文章內(nèi)容質(zhì)量較高,因此小編分享給大家做個參考,希望大家閱讀完這篇文章后對相關知識有一定的了解。

這里我們被問及關于"IBM Calgary IOMMU support (CALGARY_IOMMU)"。這個選項將會提供對IBM xSeries x366和x460的IOMMU的支持。這也將讓那些32位PCI的設備工作正常——在這些系統(tǒng)上不支持雙地址周期(DAC : Double Address Cycle)——因為該系統(tǒng)設置在訪問超過3GB內(nèi)存的時候會有問題。如果需要這些IOMMU設備可以用"iommu=off"在啟動時關閉。(這些內(nèi)核/模塊參數(shù)會在以后的文章中討論)

IOMMU(input/output memory management unit)是一個內(nèi)存管理單元(MMU),它連接具有DMA功能的I/O總線到主內(nèi)存上。DMA(Direct Memory Access)是許多計算機支持的一種允許特定設備不借助CPU直接訪問內(nèi)存的特性。雙地址周期(Double Address Cycle, DAC)是64位DMA;而通常的DMA使用32位。

下面,我們被問及是否默認啟用Calgary(Should Calgary be enabled by default? (CALGARY_IOMMU_ENABLED_BY_DEFAULT))。Calgary與上面提到的IOMMU是同一個概念。這兩者之間的不同是IOMMU可以支持許多設備而Calgary只能支持IBM IOMMU設備。如果禁用了它,但是以后需要使用到它,可以使用內(nèi)核參數(shù)(iommu=calgary)。

這里有個問題需要小心處理(Enable Maximum number of SMP Processors and NUMA Nodes (MAXSMP))。只有在內(nèi)核運行在擁有很多SMP處理器和NUMA節(jié)點的情況下才啟用它,如Core i7和許多AMD CPU芯片。如果系統(tǒng)缺乏或者只有少量的SMP處理器和NUMA節(jié)點,內(nèi)核就會變得低效。這個***選擇"No"。

非一致性內(nèi)存訪問(Non-Uniform Memory Access (NUMA))是一個每塊內(nèi)存都需要花費更長時間訪問其他部分內(nèi)存的系統(tǒng)。一個節(jié)點就是一組內(nèi)存。例如,一個NUMA系統(tǒng)可能有三塊內(nèi)存芯片。每塊芯片是一個節(jié)點,在帶CPU的主板上有一個節(jié)點/芯片(這是最快的節(jié)點),另外兩個在不同的總線上。這兩個節(jié)點需要比***個節(jié)點花費更長的時間去訪問。

注意:ccNUMA和NUMA目前是一樣的,至少是非常相似的。

對稱多處理器(Symmetric Multi-Processing (SMP))是NUMA的替代品。它的內(nèi)存在同一根總線上。只有限定數(shù)量的CPU可以訪問總線,所以這限制了SMP系統(tǒng)上處理器的數(shù)量。然而它內(nèi)存的訪問速度一樣塊。

注意:我是在為AMD64系統(tǒng)在編譯內(nèi)核,所以我會告訴你我的選擇,來幫助讀者理解過程和選擇。如果我沒有指出我的選擇,那么我用的就是默認選擇。如果你在為不同的系統(tǒng)編譯或者你有不同的需求,你需要在你的情況下做出替代的選擇。

接下來,除非配置工具已經(jīng)為你做了選擇,選擇一個內(nèi)核需要支持的最多CPU的數(shù)量。這個配置根據(jù)你給的數(shù)量優(yōu)化內(nèi)核。

接著啟用或禁用"SMT (Hyperthreading) scheduler support (SCHED_SMT)"(超線程調(diào)度器支持)。SMT調(diào)度器提升了在使用了超線程技術的Pentium 4處理器上的CPU決策能力。然而,這會帶來額外的功耗,在一些系統(tǒng)上***像我一樣選擇"no"。

超線程一種專有的SMT并行微處理器(Intel 實現(xiàn)了它)。這是多任務/多線程(同時做許多任務)的一種特殊形式,并行多線程(Simultaneous multithreading (SMT))提升了多線程執(zhí)行的效率。

在這之后,啟用或者禁用"Multi-core scheduler support (SCHED_MC)"。這樣也是一種提升多核CPU決策的特性。然而這回帶來額外功耗,我選擇了"No"。

在下一個選項中可以選擇搶占模式。

Preemption Model(搶占模式)

1. No Forced Preemption (Server) (PREEMPT_NONE) (非強制搶占)

> 2. Voluntary Kernel Preemption (Desktop) (PREEMPT_VOLUNTARY) (自愿內(nèi)核搶占)

3. Preemptible Kernel (Low-Latency Desktop) (PREEMPT) (可搶占內(nèi)核)

choice[1-3]: 2

搶占就是暫停一個意圖讓它之后繼續(xù)執(zhí)行的中斷任務的過程。搶占強制一個進程暫停,執(zhí)行中的任務無法忽視搶占。

接著,我們被詢問關于"Reroute for broken boot IRQs (X86_REROUTE_FOR_BROKEN_BOOT_IRQS)"。這是一個對于假中斷的簡單修復。假中斷是一種無用的硬件中斷,這些通常是有電子干擾或者錯誤連接的電子產(chǎn)品觸發(fā)。記住,中斷是發(fā)送給處理器需要馬上注意的信號。

這個選項對任何機器都很重要;我懷疑任何人可能都會有禁用這個特性的理由(Machine Check / overheating reporting (X86_MCE))。內(nèi)核必須意識到過熱和數(shù)據(jù)損壞,不然,系統(tǒng)將會繼續(xù)操作,這樣只會導致進一步的破壞。

下面,用戶可以啟用/禁用"Intel MCE features (X86_MCE_INTEL)",這是一種額外的對像熱度監(jiān)控的Intel MCE特性的支持。因為我是為AMD64處理器編譯內(nèi)核所以我選擇了"no"。機器檢測異常(MCE)是一種當處理器發(fā)現(xiàn)硬件問題時的錯誤輸出。MCE通常會導致內(nèi)核嚴重錯誤(kernel panic)(相當于Windows中的"藍屏")。

這個除了是AMD設備外是同一個問題Intel MCE features (X86_MCE_INTEL)。

下一個是我會禁用的調(diào)試特性(Machine check injector support (X86_MCE_INJECT))。這個會允許注射檢查。如果你偶爾執(zhí)行機器注射,那***編譯成模塊而不是編譯進內(nèi)核。機器注射可以使設備即使實際沒有錯誤也可以發(fā)送一個偽造的錯誤信息。這個用來確認內(nèi)核和其他進程可以正常處理錯誤。比如,如果CPU過熱,接著應該關機,但是開發(fā)者如何在不損壞CPU的情況下測試代碼。注射錯誤是一種***的方法,因為它只是一種告訴硬件發(fā)送錯誤信號的軟件。

注:模塊是對可能被使用或者很少執(zhí)行的特性/驅(qū)動而言的。只加入在許多使用該內(nèi)核的系統(tǒng)中用到的特性/驅(qū)動到內(nèi)核中。

如果內(nèi)核很可能用在Dell筆記本上,那么啟用這個特性(Dell laptop support (I8K))。否則,如果一些用戶可能在戴爾筆記本電腦上用到這個內(nèi)核,將其作為一個模塊加入。如果這個內(nèi)核不打算支持Dell筆記本,那就像我一樣忽略掉它。特別地,這個支持是一個允許Dell Inspiron 8000系列筆記本訪問處理器的系統(tǒng)管理模式的驅(qū)動。系統(tǒng)管理模式的目的是得到處理器的溫度和風扇狀態(tài),這對一些需要控制風扇的系統(tǒng)有用。

下面,用戶可以選擇微碼加載支持(CPU microcode loading support (MICROCODE))。這可以允許用戶在支持這個特性的AMD或者Intel芯片上更新微碼。

注意:為了加載微碼,你必須擁有一個為你的處理器設計的合法的二進制微代碼拷貝。

如果要加載微碼補丁(修復bug或加入次要的特性)到intel芯片上(Intel microcode loading support (MICROCODE_INTEL)),這個就必須啟用。這里我禁用了它。

然后是AMD芯片的類似選項(AMD microcode loading support (MICROCODE_AMD))。

啟用這個支持(/dev/cpu/*/msr - Model-specific register support (X86_MSR))可以允許某個處理器有權限使用x86特殊模塊寄存器(Model-Specific Registers (MSRs))。這些寄存器是一些字符設備,包括major 202下minor 0到31的設備((/dev/cpu/0/msr to /dev/cpu/31/msr))。這個特性用在多處理器系統(tǒng)上。每個虛擬字符設備都連接到一個特定的CPU。

注意:MSRs被用來改變CPU設備、調(diào)試、性能監(jiān)控和執(zhí)行追蹤。MSRs使用x86指令集。

在這之后,我們有一個選項"CPU information support (X86_CPUID)",啟用這個特性允許處理器訪問x86 CPUID指令,這需要通過字符設備在一個特定的CPU上執(zhí)行。這些字符設備包括major 202下minor 0到31的設備(/dev/cpu/0/msr to /dev/cpu/31/msr),就像上面x86_MSR支持的這些。

如果處理器支持,啟用內(nèi)核線性映射來使用1GB的內(nèi)存頁(Enable 1GB pages for kernel pagetables (DIRECT_GBPAGES))。啟用這個可以幫助減輕TLB的壓力。

頁是內(nèi)存本身的基本單位(位是數(shù)據(jù)的基本單位)。頁的大小是由硬件自身決定的。頁碼表是虛擬和物理內(nèi)存間的映射。物理內(nèi)存是設備上的內(nèi)存。虛擬內(nèi)存是到內(nèi)存的地址。依賴于系統(tǒng)架構,硬件可以訪問大于實際內(nèi)存地址的地址。舉例來說,一個64位系統(tǒng)擁有6GB內(nèi)存,管理員在需要時可以加上更多的內(nèi)存。這是因為還有很多虛擬內(nèi)存地址。然而,在很多32位系統(tǒng)上,系統(tǒng)管理員可以增加一條8GB的內(nèi)存,但是系統(tǒng)無法完全使用它,因為系統(tǒng)中沒有足夠的虛擬內(nèi)存地址去訪問大容量的內(nèi)存。轉換后援緩沖器(Translation Lookaside Buffer (TLB))是一種提升虛擬內(nèi)存轉換速度的緩存系統(tǒng)。

下面,我們看到了NUMA選項(Numa Memory Allocation and Scheduler Support (NUMA))。這可以允許內(nèi)核在CPU本地內(nèi)存分配器上分配CPU可使用的內(nèi)存。這個支持同樣可使內(nèi)核更好感知到NUMA。很少的32位系統(tǒng)需要這個特性,但是一些通用的645位處理器使用這個特性。我選擇了"no"。

為了系統(tǒng)使用舊方式來檢測AMD NUMA節(jié)點拓撲,啟用這個特性(Old style AMD Opteron NUMA detection (AMD_NUMA))。下一個選項是一種更新的檢測方式(ACPI NUMA detection (X86_64_ACPI_NUMA))。如果兩個都啟用,新的方式將會占支配作用。一些硬件在使用其中一種方式而不是另外一個時工作得更好。

如果為了調(diào)試目的的NUMA仿真,可以啟用下一個特性(NUMA emulation (NUMA_EMU))。

注意:如果你不打算進行調(diào)試并且你需要一個快速、輕量級系統(tǒng),那么禁用盡可能多的調(diào)試特性。

下一個選項中,選擇你的內(nèi)核打算如何處理NUMA節(jié)點的***數(shù)量。接下來選擇內(nèi)存模型,這里可能只有一個內(nèi)存模型選擇。內(nèi)存模型指定了內(nèi)存如何存儲。

Maximum NUMA Nodes (as a power of 2) (NODES_SHIFT) [6]

Memory model

> 1. Sparse Memory (SPARSEMEM_MANUAL)

choice[1]: 1

為了提升性能,這里有一個選項用通過虛擬內(nèi)存映射(Sparse Memory virtual memmap (SPARSEMEM_VMEMMAP))來優(yōu)化pfn_to_page和page_to_pfn操作。頁幀號是每頁被給定的號碼。這兩個操作用來從號碼得到頁或者從頁得到號碼。

下一個選項是允許一個節(jié)點可以移除內(nèi)存(Enable to assign a node which has only movable memory (MOVABLE_NODE))。內(nèi)核頁通常無法移除。當啟用后,用戶可以熱插拔內(nèi)存節(jié)點,同樣可移除內(nèi)存允許內(nèi)存整理。作為出入內(nèi)存的數(shù)據(jù),只要有可用空間一組數(shù)據(jù)可能被劃分到不同內(nèi)存。

接著前面的內(nèi)存問題,我們還有更多的問題。這些可能已被配置工具預配置了。第三個選項(BALLOON_COMPACTION),當啟用時可以幫助減少內(nèi)存碎片。碎片內(nèi)存會減慢系統(tǒng)速度。第四個選項(COMPACTION)允許內(nèi)存壓縮。下面列到的第五個選項(MIGRATION)允許頁面被移動。

Allow for memory hot-add (MEMORY_HOTPLUG) (允許內(nèi)存熱添加)

Allow for memory hot remove (MEMORY_HOTREMOVE) (允許內(nèi)存熱移除)

Allow for balloon memory compaction/migration (BALLOON_COMPACTION) (允許泡狀內(nèi)存規(guī)整和合并)

Allow for memory compaction (允許內(nèi)存規(guī)整)

Page migration (MIGRATION) (頁合并)

注意:啟用可移動內(nèi)存會啟用以上5個特性。

下一步,我們可以"Enable KSM for page merging (KSM)"。內(nèi)核同頁合并(Kernel Samepage Merging (KSM))會查看程序認為可以合并的內(nèi)核。如果兩頁內(nèi)存完全相同這可以節(jié)約內(nèi)存。一塊內(nèi)存可以被刪除或者被合并,并且只有一塊可以使用。

配置工具可能會自動選擇保存多少內(nèi)存用于用戶分配(Low address space to protect from user allocation (DEFAULT_MMAP_MIN_ADDR) [65536])。

下一個選項很重要(Enable recovery from hardware memory errors (MEMORY_FAILURE))。如果內(nèi)存故障并且系統(tǒng)有MCA恢復或者ECC內(nèi)存,系統(tǒng)就可以繼續(xù)運行并且恢復。要使用這個特性,硬件自身和內(nèi)核都必須支持。

機器檢測架構(Machine Check Architecture (MCA))是一個一些CPU上可以發(fā)送硬件錯誤信息給操作系統(tǒng)的特性。錯誤更正碼內(nèi)存(Error-correcting code memory (ECC memory))是一種內(nèi)存設備檢測和糾正錯誤的形式。

下面,配置工具會自動啟用"HWPoison pages injector (HWPOISON_INJECT)"。這個特性允許內(nèi)核標記一塊壞頁為"poisoned",接著內(nèi)核會殺死創(chuàng)建壞頁的程序。這有助于停止并糾正錯誤。

為了允許內(nèi)核使用大頁(Transparent Hugepage Support (TRANSPARENT_HUGEPAGE)),啟用這個特性。這可以加速系統(tǒng)但是需要更多內(nèi)存。嵌入式系統(tǒng)不必使用這個特性。嵌入式系統(tǒng)通常只有非常小的內(nèi)存。

如果啟用了上面的,那么必須配置大頁的sysfs支持。

Transparent Hugepage Support sysfs defaults

1. always (TRANSPARENT_HUGEPAGE_ALWAYS)

> 2. madvise (TRANSPARENT_HUGEPAGE_MADVISE)

choice[1-2?]: 2

下面的選項是增加process_vm_readv和process_vm_writev這兩個系統(tǒng)調(diào)用(Cross Memory Support (CROSS_MEMORY_ATTACH))。這允許特權進程訪問另外一個程序的地址空間。

如果有tmem,啟用緩存清理(cleancache)通常是一個好主意 (Enable cleancache driver to cache clean pages if Transcendent Memory (tmem) is present (CLEANCACHE))。當一些內(nèi)存頁需要從內(nèi)存中移除時,cleancache會將頁面放在cleancache-enabled的文件系統(tǒng)上。當需要該頁時,頁會被重新放回內(nèi)存中。超內(nèi)存(tmem)沒有一組已知大小的內(nèi)存,內(nèi)核對此內(nèi)存使用間接尋址。

下一個選項允許在tmen激活后緩存交換頁(Enable frontswap to cache swap pages if tmem is present (FRONTSWAP))。frontswap在交換分區(qū)放置數(shù)據(jù)。交換特性的支持需要這個。

***啟用下一個特性(Check for low memory corruption (X86_CHECK_BIOS_CORRUPTION))。這會檢測低位內(nèi)存的內(nèi)存損壞情況。這個特性在執(zhí)行期被禁止。為了啟用這個特性,在內(nèi)核命令行內(nèi)加入 "memory_corruption_check=1"(這會在以后的文章中討論;這不同于任何命令行)。即使經(jīng)常執(zhí)行這個特性,也只使用非常小的開銷(接近沒有)。

接下來我門可以設置內(nèi)存損壞檢測的默認設置(“Set the default setting of memory_corruption_check (X86_BOOTPARAM_MEMORY_CORRUPTION_CHECK))。這可以選擇是否開啟或關閉memory_corruption_check。***啟用內(nèi)存損壞檢測不然如果一部分重要內(nèi)存損壞后可能會導致數(shù)據(jù)丟失和系統(tǒng)崩潰。

這個選項關注的是BIOS(Amount of low memory, in kilobytes, to reserve for the BIOS (X86_RESERVE_LOW) [64])。配置工具通常知道給BIOS預留內(nèi)存的***大小。

對于Intel P6處理器,開發(fā)者可以啟用存儲區(qū)域類型寄存器(MTRR (Memory Type Range Register) support (MTRR))。這用于連接著VGA卡的AGP和PCI卡。啟用這個特性內(nèi)核會創(chuàng)建/proc/mtrr。

如果X驅(qū)動需要加入回寫入口,那么啟用下面的選項(MTRR cleanup support (MTRR_SANITIZER))。這會將MTRR的布局從連續(xù)轉換到離散。存儲區(qū)域類型寄存器(Memory type range registers (MTRRs))提供了一種軟件訪問CPU緩存的方法。

下面,配置工具已經(jīng)設置了一些MTRR選項

MTRR cleanup enable value (0-1) (MTRR_SANITIZER_ENABLE_DEFAULT) [1]

MTRR cleanup spare reg num (0-7) (MTRR_SANITIZER_SPARE_REG_NR_DEFAULT) [1]

為了設置頁級緩沖控制,那就啟用PAT屬性(x86 PAT support (X86_PAT))。頁屬性表(Page Attribute Table (PATs))是現(xiàn)在版的MTRRs并比它更靈活。如果你經(jīng)歷過因啟用它而引發(fā)的啟動問題,那么禁用這個特性后重新編譯內(nèi)核。我選擇了"no"。

關于如何配置Devyn的Linux內(nèi)核就分享到這里了,希望以上內(nèi)容可以對大家有一定的幫助,可以學到更多知識。如果覺得文章不錯,可以把它分享出去讓更多的人看到。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI