溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎樣定位生產(chǎn)上CPU飆高100%的問題

發(fā)布時間:2021-12-21 10:38:06 來源:億速云 閱讀:224 作者:柒染 欄目:大數(shù)據(jù)

怎樣定位生產(chǎn)上CPU飆高100%的問題,相信很多沒有經(jīng)驗(yàn)的人對此束手無策,為此本文總結(jié)了問題出現(xiàn)的原因和解決方法,通過這篇文章希望你能解決這個問題。

概括來說,分三步:

1,首先找到是哪個進(jìn)程的CPU占有率飆到了100%。

2,根據(jù)進(jìn)程號pid,定位到是哪個線程,找到對應(yīng)線程的tid。

3,導(dǎo)出對應(yīng)線程的dump日志文件,分析日志文件定位具體代碼。

要解決這個問題,你應(yīng)該具備以下技能:

1,linux的top命令。

2,jvm監(jiān)控工具jps。

3,jvm監(jiān)控工具jstack。

怎樣定位生產(chǎn)上CPU飆高100%的問題

OK,接下來我們詳細(xì)看一下如何定位問題。

一,linux的top命令如何使用

linux的top命令類似于windows下的任務(wù)管理器,我們可以使用linux命令來查看生產(chǎn)服務(wù)器的cpu使用情況。

常用命令如下:

top:每隔5秒顯示所有進(jìn)程的資源占用情況。

top -d 2:每隔2秒顯示所有進(jìn)程的資源占用情況。

top -c:每隔5秒顯示所有進(jìn)程的資源占用情況,并顯示進(jìn)程的命令行參數(shù)(默認(rèn)只有進(jìn)程名稱)。

top -p 12345 -p 6789:每隔5秒顯示12345和6789這2個進(jìn)程的資源占用情況。

top -d 2 -c -p 123456:每隔2秒顯示PID為12345的進(jìn)程的資源占用情況,并顯示該進(jìn)程啟動的命令行參數(shù)。

OK,我們可以使用下面的命令來查看某個線程下所有線程的CPU使用情況:

top -H -p pid

例如查找進(jìn)程號為12345的進(jìn)程下所有線程的使用情況:

top -H -p 12345

OK,我們離目標(biāo)更近一步了,根據(jù)PID我們找到了tid,接下來我們就要使用另外一個命令了:jstack,找到了線程id意味著接下來的工作就要交給jvm提供的分析工具了。操作系統(tǒng)只能幫我們到這里了。

二,jvm監(jiān)控工具jps

top命令很強(qiáng)大,不過我們也可以使用jvm提供的jps分析工具,這個是jvm專屬的進(jìn)程分析工具。

jps -lvm:查看當(dāng)前服務(wù)器上運(yùn)行的java進(jìn)程。我們可以獲取到j(luò)ava應(yīng)用的pid。

接下來我們使用jstack -l pid命令查看java應(yīng)用的堆棧信息。

總之,有2種方式可以獲取到j(luò)ava應(yīng)用的pid。

1,使用top命令

2,使用jps命令

jps的功能和linux的ps命令類似,都是用來查看進(jìn)程的運(yùn)行信息的。下面我們來看一下具體的參數(shù)都是什么含義。

jps -q:只列出進(jìn)程id,注意這里列出的是jvm進(jìn)程,非jvm進(jìn)程jps是無能為力的。

jps -m:列出啟動應(yīng)用時傳給main方法的參數(shù)。

jps -l:列出jvm進(jìn)程id和運(yùn)行主類全稱。

jps -v:列出jvm進(jìn)程啟動時的jvm參數(shù)。

三,jstack性能分析工具

jstack可以導(dǎo)出某個線程的運(yùn)行情況和當(dāng)前狀態(tài)等信息,命令如下:

jstack 98765 > 98765jstack.log

我們即可以把日志拉到本地來分析,也可以直接在linux上分析??傊?,我們找到了日志文件,并且知道,文件里記錄了線程98765的一些信息。接下來我們就是查看這個日志文件,定位到具體代碼的位置。

四,如何分析日志文件定位到具體的代碼

jstack導(dǎo)出的日志文件中,可能會包含以下幾個關(guān)鍵信息:

1,Deadlock:死鎖。

2,Runnable:執(zhí)行中。

3,Waiting for condition:等待資源。

4,Waiting on monitor entry:等待獲取監(jiān)視器。

5,Suspended:暫停。

6,Object.wait()或者TIMED_WAITING:對象等待中。

7,Blocked:阻塞

8,Parked:停止

CPU飆高的問題,通常線程狀態(tài)是Runnable。我們找到線程的狀態(tài)信息后,再分析下面的詳細(xì)堆棧信息,就可以大概定位到出問題的代碼。

這里還有幾個標(biāo)識我們必須要清楚:

tid:java線程id。

nid:native線程id。

prio:線程優(yōu)先級。

看完上述內(nèi)容,你們掌握怎樣定位生產(chǎn)上CPU飆高100%的問題的方法了嗎?如果還想學(xué)到更多技能或想了解更多相關(guān)內(nèi)容,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

cpu
AI