溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

Linux服務(wù)器Java進(jìn)程消失問(wèn)題解決

發(fā)布時(shí)間:2020-08-20 15:17:37 來(lái)源:腳本之家 閱讀:204 作者:myseries 欄目:編程語(yǔ)言

這篇文章主要介紹了Linux服務(wù)器Java進(jìn)程消失問(wèn)題解決,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下

問(wèn)題描述

在實(shí)際生產(chǎn)環(huán)境下,如果我們遇見(jiàn)Java進(jìn)程突然消失,該如何去排查問(wèn)題?

思路

可能有幾種原因:

①、Java應(yīng)用程序的問(wèn)題:發(fā)生OOM導(dǎo)致進(jìn)程Crash
最常見(jiàn)的是發(fā)生堆內(nèi)存異常“java.lang.OutOfMemoryError: Java heap space”,排查步驟如下:

  • Step1: 查看JVM參數(shù) -XX:+HeapDumpOnOutOfMemoryError 和 -XX:HeapDumpPath=*/java.hprof;
  • Step2: 根據(jù)HeapDumpPath指定的路徑查看是否產(chǎn)生dump文件;
  • Step3: 若存在dump文件,使用Jhat、VisualVM等工具分析即可;

②、JVM出錯(cuò):JVM或JDK自身的Bug導(dǎo)致進(jìn)程Crash

當(dāng)JVM發(fā)生致命錯(cuò)誤導(dǎo)致崩潰時(shí),會(huì)生成一個(gè)hs_err_pid_xxx.log這樣的文件,該文件包含了導(dǎo)致 JVM crash 的重要信息,我們可以通過(guò)分析該文件定位到導(dǎo)致 JVM Crash 的原因,從而修復(fù)保證系統(tǒng)穩(wěn)定。

默認(rèn)情況下,該文件是生成在工作目錄下的,當(dāng)然也可以通過(guò) JVM 參數(shù)指定生成路徑:

-XX:ErrorFile=/var/log/hs_err_pid<pid>.log
這個(gè)文件的內(nèi)容他主要有如下內(nèi)容

  • 日志頭文件
  • 導(dǎo)致 crash 的線(xiàn)程信息
  • 所有線(xiàn)程信息
  • 安全點(diǎn)和鎖信息
  • 堆信息
  • 本地代碼緩存
  • 編譯事件
  • gc 相關(guān)記錄
  • jvm 內(nèi)存映射
  • jvm 啟動(dòng)參數(shù)
  • 服務(wù)器信息

拿到這個(gè)文件后,不用說(shuō)了,慢慢啃吧。說(shuō)到這里,我要摸著良心說(shuō)。這個(gè)文件巨復(fù)雜,如果要會(huì)讀這個(gè)文件,請(qǐng)下點(diǎn)功夫。

③被操作系統(tǒng)OOM-Killer

Linux 內(nèi)核有個(gè)機(jī)制叫OOM killer(Out-Of-Memory killer),該機(jī)制會(huì)監(jiān)控那些占用內(nèi)存過(guò)大,尤其是瞬間很快消耗大量?jī)?nèi)存的進(jìn)程,為了防止內(nèi)存耗盡而內(nèi)核會(huì)把該進(jìn)程殺掉。

因此,你發(fā)現(xiàn)java進(jìn)程突然沒(méi)了,首先要懷疑是不是被linux的OOM killer給干掉了!

你可以去下面這個(gè)文件里翻

系統(tǒng)報(bào)錯(cuò)日志:/var/log/messages

你執(zhí)行命令

egrep -i 'killed process' /var/log/messages 
# egrep = grep -E 可以使用基本的正則表達(dá)外, 還可以用擴(kuò)展表達(dá)式, -i代表忽略大小寫(xiě) 
#或者
grep “Out of memory” /var/log/messages

去日志里進(jìn)行查詢(xún)。

當(dāng)然,你也可以去內(nèi)核日志里頭查詢(xún)。有時(shí)Linux系統(tǒng)或者系統(tǒng)上運(yùn)行的java或者其它進(jìn)程,會(huì)發(fā)生一些莫名其妙的問(wèn)題,比如突然掛掉了,比如突然重啟等等。在軟件上找不到問(wèn)題所在,此時(shí)我們應(yīng)該懷疑硬件或者內(nèi)核的問(wèn)題,此時(shí)我們就可以使用 dmesg來(lái)查看:

dmesg -T| grep java
#或者
dmesg -T | grep 'Out of memory'
# -T 是顯示時(shí)間戳

Linux服務(wù)器Java進(jìn)程消失問(wèn)題解決

再對(duì)比java日志停止時(shí)間,看來(lái)這里才是問(wèn)題的根源,所以接下來(lái)從優(yōu)化java內(nèi)存占用、加內(nèi)存入手嘗試解決問(wèn)題吧!

備注:

dmesg命令是用來(lái)在Unix-like系統(tǒng)中顯示內(nèi)核的相關(guān)信息的。dmesg全稱(chēng)是display message (or display driver),即顯示信息。

實(shí)際上,dmesg命令是從內(nèi)核環(huán)形緩沖區(qū)中獲取數(shù)據(jù)的。當(dāng)我們?cè)贚inux上排除故障時(shí),dmesg命令會(huì)十分方便,它能很好地幫我們鑒別硬件相關(guān)的error和warning。除此之外,dmesg命令還能打印出守護(hù)進(jìn)程相關(guān)的信息,已幫助我們debug。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀(guān)點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI