溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

如何理解CPU占用百分百問題

發(fā)布時間：2021-10-22 15:39:56 來源：億速云閱讀：336 作者：iii 欄目：數據庫

這篇文章主要介紹“如何理解CPU占用百分百問題”，在日常操作中，相信很多人在如何理解CPU占用百分百問題問題上存在疑惑，小編查閱了各式資料，整理出簡單好用的操作方法，希望對大家解答”如何理解CPU占用百分百問題”的疑惑有所幫助！接下來，請跟著小編一起來學習吧！

怎么看懂CPU使用率

以 Linux 的 top 命令為例，效果如下：

如何理解CPU占用百分百問題

Top 命令

在 %CPU 這一列就展示了 CPU 的使用情況，百分比指代的是總體上占用的時間百分比：

%us：表示用戶進程的 CPU 使用時間（沒有通過 nice 調度）
%sy：表示系統(tǒng)進程的 CPU 使用時間，主要是內核使用。
%ni：表示用戶進程中，通過 CPU 調度（nice）過的使用時間。
%id：空閑的 CPU 時間
%wa：CPU 運行時在等待 IO 的時間
%hi：CPU 處理硬中斷花費的時間
%si：CPU 處理軟中斷花費的時間
%st：被虛擬機偷走的 CPU 時間

通常情況下，我們討論的 CPU 使用率過高，指的是 %us 這個指標，監(jiān)控里面的 CPU 使用率通常也是這個值（也有用其他的方法計算出來的，不過簡單起見，不考慮其他的情況）。其他幾個指標過高也代表出 MySQL 的狀態(tài)異常，簡單起見，這里主要還是指 %us 過高的場景。

MySQL和線程

MySQL 是單進程多線程的結構，意味著獨占的 MySQL 服務器里面，只能用 top 命令看到一行數據。

如何理解CPU占用百分百問題

TOP 命令效果

這里能看到的是 MySQL 的進程 ID，如果要看到線程的情況，需要用top -H

如何理解CPU占用百分百問題

TOP 命令效果

在這里能看到的是 MySQL 各個線程的 ID，可以看到 MySQL 在啟動之后，會創(chuàng)建非常多的內部線程來工作。

這些內部線程包括 MySQL 自己用來刷臟，讀寫數據等操作的系統(tǒng)線程，也包括處理用戶 SQL 的線程，姑且叫做用戶線程吧。用戶線程有一個特殊的地方：程序端發(fā)送到 MySQL 端的 SQL，只會由一個用戶線程來執(zhí)行（one-thread-per-connection），所以 MySQL 在處理復雜查詢的時候，會出現“一核有難，多核圍觀”的尷尬現象。

參考 %us 的定義，對于 Linux 系統(tǒng)來說，MySQL 進程和它啟動的所有線程都不算內核進程，因此 MySQL 的系統(tǒng)線程和用戶線程在繁忙的時候，都會體現在 CPU 使用率的 %us 指標上。

什么時候CPU會100%

MySQL 干什么的時候，CPU 會 100%？從前文的分析來看，MySQL 主要是兩類線程占用 CPU：系統(tǒng)線程和用戶線程。因此 MySQL 獨占的服務器上，只需要留意一下這兩類線程的情況，就能 Cover 住絕大部分的問題場景。

系統(tǒng)線程

在實際的環(huán)境中，系統(tǒng)線程遇到問題的情況會比較少，一般來說，多個系統(tǒng)線程很少會同時跑滿，只要服務器的可用核心數大于等于 4 的話，一般也不會遇到 CPU 100%，當然有一些 bug 可能會有影響，比如這個：

MySQL BUG

雖然情況比較少，但是在面對問題的常規(guī)排查過程中，系統(tǒng)線程的問題也是需要關注的。

用戶線程

提到用戶線程繁忙，很多時候肯定會第一時間憑經驗想到慢查詢。確實 90% 以上的時候都是“慢查詢”引起的，不過作為方法論，還是要根據分析再去得出結論的~

參考 us% 的定義，是指用戶線程占用 CPU 的時間多少，這代表著用戶線程占用了大量的時間。

一方面是在進行長時間的計算，例如：order by，group by，臨時表，join 等。這一類問題可能是查詢效率不高，導致單個 SQL 語句長時間占用 CPU 時間，也有可能是單純的數據量比較多，導致計算量巨大。另一方面是單純的 QPS 壓力高，所以 CPU 的時間被用滿了，比如 4 核的服務器用來支撐 20k 到 30k 的點查詢，每個 SQL 占用的 CPU 時間并不多，但是因為整體的 QPS 很高，所以 CPU 的時間被占滿了。

問題的定位

分析完之后，就要開始實戰(zhàn)了，這里根據前文的分析給出一些經典的 CPU 100% 場景，并給出簡要的定位方法作為參考。

PS：系統(tǒng)線程的 bug 的場景 skip，以后有機會再作為詳細的案例來分析。

慢查詢

在 CPU 100% 這個問題已經發(fā)生之后，真實的慢查詢和因為 CPU 100% 導致被影響的普通查詢會混在一起，難以直觀的看 processlist 或者 slowlog 來發(fā)現元兇，這時候就需要一些比較明確的特征來進行甄別。

從前文的簡單分析可以看出來，查詢效率不高的慢查詢通常有以下幾種情況：

全表掃描：Handler_read_rnd_next 這個值會大幅度突增，且這一類查詢在 slowlog 中 row_examined 的值也會非常高。
索引效率不高，索引選錯了：Handler_read_next 這個值會大幅度的突增，不過要注意這種情況也有可能是業(yè)務量突增引起的，需要結合 QPS/TPS 一起看。這一類查詢在 slowlog 中找起來會比較麻煩，row_examined 的值一般在故障前后會有比較明顯的不同，或者是不合理的偏高。

比如數據傾斜的場景，一個小范圍的 range 查詢在某個特定的范圍內 row_examined 非常高，而其他的范圍時 row_examined 比較低，那么就可能是這個索引效率不高。

排序比較多：order by，group by 這一類查詢通常不太好從 Handler 的指標直接判斷，如果沒有索引或者索引不好，導致排序操作沒有消除的話，那么在 processlist 和 slowlog 通常能看到這一類查詢語句出現的比較多。

當然，不想詳細的分析 MySQL 指標或者是情況比較緊急的話，可以直接在 slowlog 里面用 rows_sent 和 row_examined 做個簡單的除法，比如 row_examined/rows_sent > 1000 的都可以拿出來作為“嫌疑人”處理。這類問題一般在索引方面做好優(yōu)化就能解決。

PS：1000 只是個經驗值，具體要根據實際業(yè)務情況來定。

計算量大

這一類問題通常是因為數據量比較大，即使索引沒什么問題，執(zhí)行計劃也 OK，也會導致 CPU 100%，而且結合 MySQL one-thread-per-connection 的特性，并不需要太多的并發(fā)就能把 CPU 使用率跑滿。這一類查詢其實是是比較好查的，因為執(zhí)行時間一般會比較久，在 processlist 里面就會非常顯眼，反而是 slowlog 里面可能找不到，因為沒有執(zhí)行完的語句是不會記錄的。

這一類問題一般來說有三種比較常規(guī)的解決方案：

鴻蒙官方戰(zhàn)略合作共建——HarmonyOS技術社區(qū)
讀寫分離，把這一類查詢放到平時業(yè)務不怎么用的只讀從庫去。
在程序段拆分 SQL，把單個大查詢拆分成多個小查詢。
使用 HBASE，Spark 等 OLAP 的方案來支持。

高 QPS

這一類問題單純的就是硬件資源的瓶頸，不論是 row_examined/rows_sent 的比值，還是 SQL 的索引、執(zhí)行計劃，或者是 SQL 的計算量都不會有什么明顯問題，只是 QPS 指標會比較高，而且 processlist 里面可能什么內容都看不到，例如：

如何理解CPU占用百分百問題

到此，關于“如何理解CPU占用百分百問題”的學習就結束了，希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習，快去試試吧！若想繼續(xù)學習更多相關知識，請繼續(xù)關注億速云網站，小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>

向AI問一下細節(jié)

推薦閱讀：

免責聲明：本站發(fā)布的內容（圖片、視頻和文字）以原創(chuàng)、轉載和分享為主，文章觀點不代表本網站立場，如果涉及侵權請聯系站長郵箱：is@yisu.com進行舉報，并提供相關證據，一經查實，將立刻刪除涉嫌侵權內容。

上一篇新聞：
SQL的數據清洗方法有哪些
下一篇新聞：
MySQL分庫分表后總存儲變大了的原因是什么

猜你喜歡

AI
助
手

產品服務

地區(qū)劃分

專題活動

幫助支持

關于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關注億速云

億速云公眾號

手機網站二維碼