溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Linux常見死機原因有哪些

發(fā)布時間:2021-07-10 15:25:29 來源:億速云 閱讀:284 作者:chen 欄目:系統(tǒng)運維

本篇內(nèi)容主要講解“Linux常見死機原因有哪些”,感興趣的朋友不妨來看看。本文介紹的方法操作簡單快捷,實用性強。下面就讓小編來帶大家學習“Linux常見死機原因有哪些”吧!

在排除了硬件故障/firmware版本/BIOS等等問題之外, Linux死機通常可能碰到如下幾種情況

1, 如果你的Linux死機的時候控制臺上有亂七八糟的字符。恭喜你,這種情況叫做oops. 通常是Linux kernel認為自己發(fā)生了異常造成的。

可以通過oops消息查找出錯的地方。

2, 如果你的機器僵死,那么問題麻煩了。這種時候,通常是Kernel出現(xiàn)了死鎖。Kernel不會知道自己死鎖了,所以不會在屏幕上顯示任何咚咚。
如果運氣好,此時Kernel也許可能能夠響應中斷。不管怎樣,你都無法進一步操作了。

3, 嚴格來說,這第三種情況不算死機,現(xiàn)象如下:輸入命令回車之后命令不能返回任何結(jié)果, 但是控制臺對回車可能有相應。但是命令無法結(jié)束,也不會有輸出結(jié)果。
但是可以換到下一個控制臺, 而且還可以繼續(xù)輸入命令,但是輸入命令之后還是沒有輸出。這種情況會有很多可能。通常是應用程序的系統(tǒng)調(diào)用長時間沒有返回或者是滿足不了應用的要求。

以上三種情況,system log的作用都不大。通常日志都不會紀錄。所以只能使用Kernel的Debug工具。

不過Linus比較狠,人說Kernel不需要Debug工具。所以kernel.org中的代碼是沒有debug工具的。不過目前絕大多數(shù)發(fā)行版的kernel都帶了debug工具,而且工具都不一樣。

通常進行kernel debug都需要在出現(xiàn)故障的時候采集vmcore. 就是把故障發(fā)生的時memory dump出來。(還記得Windows 藍屏的時候會出現(xiàn)1%-100%跳動的一個數(shù)字和c盤dump.sys文件, 這回知道干什么的了吧? )  然后進行分析。也許你會擔心Linux死機了,還怎么dump memory啊,這個不用擔心,Kernel還是留了好幾條路子。其中一個是NMI。

那么到底怎么dump memory呢? 這里用REDHAT為例,RHEL3,RHEL4中都使用了netdump作為采集工具,RHEL5使用kdump作為采集工具。

采集完畢就可以對vmcore進行分析,步驟就不細說了??梢詤⒖既缦挛恼?http://people.redhat.com/anderson/crash_whitepaper/

但是對于管理員來說,任何一個debug工具都需要代碼開發(fā)的經(jīng)歷才能順利使用。


最后說一句,最近在壇中看到有人看到死機就往應用程序上懷疑。這是很好的自我批評的精神,要大力發(fā)揚。

那么,腳本,應用程序會不會導致死機? 當然,但是問題還是出在Kernel上。就比如,應用程序?qū)懳募到y(tǒng)可能會掛起在kernel中的文件系統(tǒng)代碼上。
 

到此,相信大家對“Linux常見死機原因有哪些”有了更深的了解,不妨來實際操作一番吧!這里是億速云網(wǎng)站,更多相關內(nèi)容可以進入相關頻道進行查詢,關注我們,繼續(xù)學習!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI