溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

【Mysql】主機cpu 之-sys使用率過高

發(fā)布時間:2020-08-17 18:34:04 來源:ITPUB博客 閱讀:171 作者:小亮520cl 欄目:MySQL數(shù)據庫
學習大神的http://mp.weixin.qq.com/s/hXtCzSnlVfo9Cq92538ipw自己整理一點思路
1.0top看cpu消耗,發(fā)現(xiàn)sys比usr要高不少,這非常不正常


1.1使用pstack看 MySQL所有線程的調用棧:

InnoDB線程同步機制

我們知道linux線程同步有Mutex,spin lock,條件變量,rw lock等多種同步機制,InnoDB并沒有直接使用系統(tǒng)的同步機制,而是自己定義了互斥結構數(shù)據結構kernel_mutex,將系統(tǒng)的spin lock,mutex,和條件變量融合一起

【Mysql】主機cpu 之-sys使用率過高

如圖,kernel_mutexmutex對象的中重要的結構成員為os_event和lock_word。

  • kernel_mutex主要涉及mutex_create,mutex_enter,mutex_exit函數(shù),會分別使用glibc的malloc()和free()調用動態(tài)分配和釋放內存

  • 封裝mutex和條件變量,圖中綠色框區(qū)域
    MySQL線程之間發(fā)送異步信號來進行同步主要通過os_event_struct結構體中的os_mutex(封裝os的pthread_mutex_t)和cond_var(封裝os的pthread_cond_t)成員對象實現(xiàn)。當InnoDB在獲取鎖的時候,首先先努力自旋一段時間,如果超過innodb_sync_spin_loops的閾值,就會通過函數(shù)os_event_wait_low()在os_event_struct->cond_var上等待。如圖,當某個線程釋放了鎖的時候,通過os_cond_broadcast嘗試發(fā)送廣播喚醒所有等待os_event_struct->cond_var條件變量的線程.這些線程被喚醒后又繼續(xù)競爭爭搶os_event_struct->os_mutex

  • spin lock,圖中黃色框區(qū)域
    通過lock_word做spin wait。線程想要爭搶鎖的時候先判斷這個值,如果lock_word為1就繼續(xù)自旋等待。如果發(fā)現(xiàn)其他線程釋放了鎖該值變?yōu)?的時候,就通過test_and_set改為1,"告訴"其他線程這把鎖被持有了

InnoDB這樣設計的目的都是延緩線程被掛起并進入os wait的速度,因為每一次進入os wait等待被喚醒或者喚醒都會進行一次上下文切換.但是也只能是延緩,并不能阻止,如果持續(xù)惡化得不到環(huán)境,最后仍然會進入os的等待隊列,將會產生大量的上下文切換。但是有兩個問題:

  • kernel_mutex是個全局鎖,保護事務,buffer pool,鎖,等InnoDB存儲引擎實現(xiàn)的大部分對象.當MySQL突然有大量訪問,并發(fā)一旦非常高的時候,mutex沖突非常劇烈,此時臨界區(qū)變得非常大,同時也會浪費cpu很多時間空轉。所以這也解釋了sys cpu大量消耗在自選空轉中

  • 并且并發(fā)高的時候會頻繁調用malloc()申請內存,而glibc本身的malloc()本書頻繁調用系統(tǒng)mutex_lock()和unlock(),在多線程高并發(fā)場景下并且資源不足的場景下,也會造成系統(tǒng)各種mutex競爭嚴重。大量線程被掛起等待os pthread_cond_broadcast廣播被喚醒,隨之而來的是大量的上下文切換

通過dstat看到此時cpu每秒有近20W次的上下文切換,綜上所述,sys cpu負載高主要以下:

  • (1)cpu內核態(tài)spin,大量線程cpu在內核態(tài)自旋等待

  • (2)系統(tǒng)上下文切換,又分為:

    • spin仍然失敗的,最終進入os wait,調用pthread_cond_wait等待條件滿足時被喚醒

    • malloc()頻繁加減os mutex,且系統(tǒng)內存緊張


1.3繼續(xù)觀察內存分配使用的情況.
sar -B 看內存頁回收,其中pgscank/s,對應kswapd回收,pgscand/s對應的MySQL線程直接回收
【Mysql】主機cpu 之-sys使用率過高

pgscand/s不為0,說明內存資源緊張,MySQL直接回收內存。

可是free命令看內存free并沒有用光。經過一番調查發(fā)現(xiàn)是numa搞的鬼
用numactl --hardware命令看:

available: 2 nodes (0-1)
node 0 cpus: 0 1 2 3node 0 size: 32733 MB
node 0 free: 1900 MB
node 1 cpus: 4 5 6 7node 1 size: 32768 MB
node 1 free: 20 MB
node distances:
node   0   1  0:  10  20  1:  20  10 

雖然內存整體free沒有用光,但是在numa默認的內存分配機制下,內存使用嚴重不均,node0還十分充足,但是node1幾乎用光

還可以使用strace來診斷!

https://huoding.com/2015/10/16/474


向AI問一下細節(jié)

免責聲明:本站發(fā)布的內容(圖片、視頻和文字)以原創(chuàng)、轉載和分享為主,文章觀點不代表本網站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據,一經查實,將立刻刪除涉嫌侵權內容。

AI