溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

一次緩存性能問題排查

發(fā)布時間:2020-06-23 12:39:57 來源:網(wǎng)絡(luò) 閱讀:473 作者:樂少黑板報 欄目:軟件技術(shù)

概述

以下分享的都跳過了很多坑,包括redis、tomcat環(huán)境配置、機器硬件配置等等問題(與線上保持一致,或者硬件性能減配系數(shù),例如線上:8C16G,壓測:4C8G,系數(shù)簡單相差2倍),直接把挖掘瓶頸的主要思路搬出臺面。

壓測數(shù)據(jù)分析

全局圖預(yù)覽

一次緩存性能問題排查cdn.xitu.io/2018/11/29/1675ebca0b8bfcb2?w=1919&h=880&f=png&s=125839">


一次緩存性能問題排查      


通過對某直播觀看頁面進行高并發(fā)壓測,在APM(Pinpoint)監(jiān)控中發(fā)現(xiàn)一個有趣的地方:

一次緩存性能問題排查      

上圖中兩個紅框中的數(shù)據(jù)(接近10s),相隔大概30分鐘就發(fā)生,16:20左右,系統(tǒng)撐不住服務(wù)出現(xiàn)異常不可用,懷著好奇的心態(tài),追查方法調(diào)用的棧,如下圖所示:

一次緩存性能問題排查      

該方法耗時多久呢?首先搞清楚Call Tree里面的一些概念:

一次緩存性能問題排查      

可見這個sql查詢方法耗時14秒多,為什么呢?APM里面已經(jīng)顯示了sql語句,在mysql中執(zhí)行查詢發(fā)現(xiàn)執(zhí)行時間很快,那么問題出在哪里呢?只能繼續(xù)深挖!

通過對比同樣的url,請求響應(yīng)毫秒級的情況下,發(fā)現(xiàn)數(shù)據(jù)如下圖所示:

一次緩存性能問題排查      

從redis獲取到數(shù)據(jù)后,并沒有再執(zhí)行sql查詢了,通過這個分析,我們決定追蹤代碼還原真相(不懂代碼的測試不是好開發(fā)):

一次緩存性能問題排查      

一次緩存性能問題排查      

可以看到緩存失效之后,直接查詢數(shù)據(jù)庫了

解決方案

SQL優(yōu)化:優(yōu)先級低

從數(shù)據(jù)分析來看,sql優(yōu)化的用處不大,并不是返回了大量數(shù)據(jù)缺少索引,此次可以跳過。

緩存并發(fā):優(yōu)先級高

  出現(xiàn)場景:當(dāng)網(wǎng)站并發(fā)訪問高,一個緩存如果失效,可能出現(xiàn)多個進程同時查詢DB,同時設(shè)置緩存的情況,如果并發(fā)確實很大,這也可能造成DB壓力過大,還有緩存頻繁更新的問題。
  處理方法:對緩存查詢加鎖,如果KEY不存在,就加鎖,然后查DB入緩存,然后解鎖;其他進程如果發(fā)現(xiàn)有鎖就等待,然后等解鎖后返回數(shù)據(jù)或者進入DB查詢。



經(jīng)驗總結(jié)

1、善用監(jiān)控工具,例如APM,進行鏈路監(jiān)控、服務(wù)器性能、方法調(diào)用順序觀察

2、追蹤方法棧和相關(guān)日志

3、深入排查代碼挖本質(zhì)


微信公眾號:樂少黑板報



向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI