溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么解決Linux內(nèi)核內(nèi)存泄漏

發(fā)布時間:2021-11-23 14:55:17 來源:億速云 閱讀:796 作者:iii 欄目:系統(tǒng)運(yùn)維

這篇文章主要講解了“怎么解決Linux內(nèi)核內(nèi)存泄漏”,文中的講解內(nèi)容簡單清晰,易于學(xué)習(xí)與理解,下面請大家跟著小編的思路慢慢深入,一起來研究和學(xué)習(xí)“怎么解決Linux內(nèi)核內(nèi)存泄漏”吧!

什么是內(nèi)存泄漏:

程序向系統(tǒng)申請內(nèi)存,使用完不需要之后,不釋放內(nèi)存還給系統(tǒng)回收,造成申請的內(nèi)存被浪費(fèi).

發(fā)現(xiàn)系統(tǒng)中內(nèi)存使用量隨著時間的流逝,消耗的越來越多,例如下圖所示:

怎么解決Linux內(nèi)核內(nèi)存泄漏

接下來的排查思路是:

1.監(jiān)控系統(tǒng)中每個用戶進(jìn)程消耗的PSS (使用pmap工具(pmap pid)).

PSS:按比例報告的物理內(nèi)存,比如進(jìn)程A占用20M物理內(nèi)存,進(jìn)程B和進(jìn)程A共享5M物理內(nèi)存,那么進(jìn)程A的PSS就是(20 - 5) + 5/2 =  17.5M

2.監(jiān)控/proc/meminfo輸出,重點(diǎn)觀察Slab使用量和slab對應(yīng)的/proc/slabinfo信息

3.參考/proc/meminfo輸出,計算系統(tǒng)中未被統(tǒng)計的內(nèi)存變化,比如內(nèi)核驅(qū)動代碼

直接調(diào)用alloc_page()從buddy中拿走的內(nèi)存不會被單獨(dú)統(tǒng)計

以上排查思路分別對應(yīng)下圖中的1,2,3 :

怎么解決Linux內(nèi)核內(nèi)存泄漏

在排查的過程中發(fā)現(xiàn)系統(tǒng)非??臻e,都沒有跑任何用戶業(yè)務(wù)進(jìn)程。

其中在使用slabtop監(jiān)控slab的使用情況時發(fā)現(xiàn)size-4096 不停增長

怎么解決Linux內(nèi)核內(nèi)存泄漏

通過監(jiān)控/proc/slabinfo也發(fā)現(xiàn)SReclaimable 的使用量不停增長

while true;  do  sleep 1 ;  cat /proc/slabinfo >> /tmp/slabinfo.txt ;  echo "===" >> /tmp/slabinfo.txt ;  done

由此判斷很可能是內(nèi)核空間在使用size-4096 時發(fā)生了內(nèi)存泄漏.

接下來使用trace event(tracepoint)功能來監(jiān)控size-4096的使用和釋放過程,

主要用來跟蹤kmalloc()和kfree()函數(shù)對應(yīng)的trace event, 因?yàn)樗麄兊膖race  event被觸發(fā)之后會打印kmalloc()和kfree()所申請和釋放的內(nèi)存地址,然后進(jìn)一步只過濾申請4096字節(jié)的情況。

#trace-cmd record -e kmalloc  -f 'bytes_alloc==4096' -e kfree -T

(-T 打印堆棧)

等待幾分鐘之后…

#cp /sys/kernel/debug/tracing/trace_pipe  /tmp/kmalloc-trace

#trace-cmd report

以上步驟相當(dāng)于:

怎么解決Linux內(nèi)核內(nèi)存泄漏

等待幾分鐘之后…

#cp /sys/kernel/debug/tracing/trace_pipe /tmp/kmalloc-trace

從trace-cmd report的輸出結(jié)果來看,很多kmalloc 對應(yīng)的ptr值都沒有kfree與之對應(yīng)的ptr值

怎么解決Linux內(nèi)核內(nèi)存泄漏

這就說明了cat進(jìn)程在內(nèi)核空間使用size-4096之后并沒有釋放,造成了內(nèi)存泄漏。

為了進(jìn)一步精確定位到是使用哪個內(nèi)核函數(shù)造成的問題,此時手動觸發(fā)vmcore

#echo c > /proc/sysrq-trigger

然后使用crash工具分析vmcore:

#crash ./vmcore ./vmlinux.debug

讀出上面kmalloc申請的ptr內(nèi)存信息

怎么解決Linux內(nèi)核內(nèi)存泄漏

(讀取0xffff880423744000內(nèi)存開始的4096個字節(jié),并以字符形式顯示)

怎么解決Linux內(nèi)核內(nèi)存泄漏

發(fā)現(xiàn)從上面幾個ptr內(nèi)存中讀出的內(nèi)容都是非常相似,仔細(xì)看一下發(fā)現(xiàn)都是/proc/schedstat 的輸出內(nèi)容。

通過閱讀相關(guān)代碼發(fā)現(xiàn),當(dāng)讀出/proc/schedstat內(nèi)容之后,確實(shí)沒有釋放內(nèi)存

怎么解決Linux內(nèi)核內(nèi)存泄漏

然后發(fā)現(xiàn)kernel上游已經(jīng)有patch解決了這個問題:

commit: 8e0bcc722289

fix a leak in /proc/schedstats

感謝各位的閱讀,以上就是“怎么解決Linux內(nèi)核內(nèi)存泄漏”的內(nèi)容了,經(jīng)過本文的學(xué)習(xí)后,相信大家對怎么解決Linux內(nèi)核內(nèi)存泄漏這一問題有了更深刻的體會,具體使用情況還需要大家實(shí)踐驗(yàn)證。這里是億速云,小編將為大家推送更多相關(guān)知識點(diǎn)的文章,歡迎關(guān)注!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI