溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

Java緩存更新的原理是什么

發(fā)布時間：2021-12-21 11:52:53 來源：億速云閱讀：335 作者：iii 欄目：開發(fā)技術(shù)

這篇文章主要介紹“Java緩存更新的原理是什么”，在日常操作中，相信很多人在Java緩存更新的原理是什么問題上存在疑惑，小編查閱了各式資料，整理出簡單好用的操作方法，希望對大家解答”Java緩存更新的原理是什么”的疑惑有所幫助！接下來，請跟著小編一起來學(xué)習(xí)吧！

緩存更新的套路

看到好些人在寫更新緩存數(shù)據(jù)代碼時，先刪除緩存，然后再更新數(shù)據(jù)庫，而后續(xù)的操作會把數(shù)據(jù)再裝載的緩存中。然而，這個是邏輯是錯誤的。試想，兩個并發(fā)操作，一個是更新操作，另一個是查詢操作，更新操作刪除緩存后，查詢操作沒有命中緩存，先把老數(shù)據(jù)讀出來后放到緩存中，然后更新操作更新了數(shù)據(jù)庫。于是，在緩存中的數(shù)據(jù)還是老的數(shù)據(jù)，導(dǎo)致緩存中的數(shù)據(jù)是臟的，而且還一直這樣臟下去了。

我不知道為什么這么多人用的都是這個邏輯，當(dāng)我在微博上發(fā)了這個貼以后，我發(fā)現(xiàn)好些人給了好多非常復(fù)雜和詭異的方案，所以，我想寫這篇文章說一下幾個緩存更新的Design Pattern（讓我們多一些套路吧）。

這里，我們先不討論更新緩存和更新數(shù)據(jù)這兩個事是一個事務(wù)的事，或是會有失敗的可能，我們先假設(shè)更新數(shù)據(jù)庫和更新緩存都可以成功的情況（我們先把成功的代碼邏輯先寫對）。

更新緩存的的Design Pattern有四種：Cache aside, Read through, Write through, Write behind caching，我們下面一一來看一下這四種Pattern。

Cache Aside Pattern

這是最常用最常用的pattern了。其具體邏輯如下：

失效：應(yīng)用程序先從cache取數(shù)據(jù)，沒有得到，則從數(shù)據(jù)庫中取數(shù)據(jù)，成功后，放到緩存中。
命中：應(yīng)用程序從cache中取數(shù)據(jù)，取到后返回。
更新：先把數(shù)據(jù)存到數(shù)據(jù)庫中，成功后，再讓緩存失效。

Java緩存更新的原理是什么

Java緩存更新的原理是什么

注意，我們的更新是先更新數(shù)據(jù)庫，成功后，讓緩存失效。那么，這種方式是否可以沒有文章前面提到過的那個問題呢？我們可以腦補(bǔ)一下。

一個是查詢操作，一個是更新操作的并發(fā)，首先，沒有了刪除cache數(shù)據(jù)的操作了，而是先更新了數(shù)據(jù)庫中的數(shù)據(jù)，此時，緩存依然有效，所以，并發(fā)的查詢操作拿的是沒有更新的數(shù)據(jù)，但是，更新操作馬上讓緩存的失效了，后續(xù)的查詢操作再把數(shù)據(jù)從數(shù)據(jù)庫中拉出來。而不會像文章開頭的那個邏輯產(chǎn)生的問題，后續(xù)的查詢操作一直都在取老的數(shù)據(jù)。

這是標(biāo)準(zhǔn)的design pattern，包括Facebook的論文《 Scaling Memcache at Facebook》也使用了這個策略。為什么不是寫完數(shù)據(jù)庫后更新緩存？你可以看一下Quora上的這個問答《 Why does Facebook use delete to remove the key-value pair in Memcached instead of updating the Memcached during write request to the backend?》，主要是怕兩個并發(fā)的寫操作導(dǎo)致臟數(shù)據(jù)。

那么，是不是Cache Aside這個就不會有并發(fā)問題了？不是的，比如，一個是讀操作，但是沒有命中緩存，然后就到數(shù)據(jù)庫中取數(shù)據(jù)，此時來了一個寫操作，寫完數(shù)據(jù)庫后，讓緩存失效，然后，之前的那個讀操作再把老的數(shù)據(jù)放進(jìn)去，所以，會造成臟數(shù)據(jù)。

但，這個case理論上會出現(xiàn)，不過，實際上出現(xiàn)的概率可能非常低，因為這個條件需要發(fā)生在讀緩存時緩存失效，而且并發(fā)著有一個寫操作。而實際上數(shù)據(jù)庫的寫操作會比讀操作慢得多，而且還要鎖表，而讀操作必需在寫操作前進(jìn)入數(shù)據(jù)庫操作，而又要晚于寫操作更新緩存，所有的這些條件都具備的概率基本并不大。

所以，這也就是Quora上的那個答案里說的，要么通過2PC或是Paxos協(xié)議保證一致性，要么就是拼命的降低并發(fā)時臟數(shù)據(jù)的概率，而Facebook使用了這個降低概率的玩法，因為2PC太慢，而Paxos太復(fù)雜。當(dāng)然，最好還是為緩存設(shè)置上過期時間。

Read/Write Through Pattern

我們可以看到，在上面的Cache Aside套路中，我們的應(yīng)用代碼需要維護(hù)兩個數(shù)據(jù)存儲，一個是緩存（Cache），一個是數(shù)據(jù)庫（Repository）。所以，應(yīng)用程序比較啰嗦。而Read/Write Through套路是把更新數(shù)據(jù)庫（Repository）的操作由緩存自己代理了，所以，對于應(yīng)用層來說，就簡單很多了。可以理解為，應(yīng)用認(rèn)為后端就是一個單一的存儲，而存儲自己維護(hù)自己的Cache。

Read Through

Read Through 套路就是在查詢操作中更新緩存，也就是說，當(dāng)緩存失效的時候（過期或LRU換出），Cache Aside是由調(diào)用方負(fù)責(zé)把數(shù)據(jù)加載入緩存，而Read Through則用緩存服務(wù)自己來加載，從而對應(yīng)用方是透明的。

Write Through

Write Through 套路和Read Through相仿，不過是在更新數(shù)據(jù)時發(fā)生。當(dāng)有數(shù)據(jù)更新的時候，如果沒有命中緩存，直接更新數(shù)據(jù)庫，然后返回。如果命中了緩存，則更新緩存，然后再由Cache自己更新數(shù)據(jù)庫（這是一個同步操作）

下圖自來Wikipedia的 Cache詞條)。其中的Memory你可以理解為就是我們例子里的數(shù)據(jù)庫。

Java緩存更新的原理是什么

Write Behind Caching Pattern

Write Behind 又叫 Write Back。一些了解Linux操作系統(tǒng)內(nèi)核的同學(xué)對write back應(yīng)該非常熟悉，這不就是Linux文件系統(tǒng)的Page Cache的算法嗎？是的，你看基礎(chǔ)這玩意全都是相通的。所以，基礎(chǔ)很重要，我已經(jīng)不是一次說過基礎(chǔ)很重要這事了。

Write Back套路，一句說就是，在更新數(shù)據(jù)的時候，只更新緩存，不更新數(shù)據(jù)庫，而我們的緩存會異步地批量更新數(shù)據(jù)庫。這個設(shè)計的好處就是讓數(shù)據(jù)的I/O操作飛快無比（因為直接操作內(nèi)存嘛），因為異步，write backg還可以合并對同一個數(shù)據(jù)的多次操作，所以性能的提高是相當(dāng)可觀的。

但是，其帶來的問題是，數(shù)據(jù)不是強(qiáng)一致性的，而且可能會丟失（我們知道Unix/Linux非正常關(guān)機(jī)會導(dǎo)致數(shù)據(jù)丟失，就是因為這個事）。在軟件設(shè)計上，我們基本上不可能做出一個沒有缺陷的設(shè)計，就像算法設(shè)計中的時間換空間，空間換時間一個道理，有時候，強(qiáng)一致性和高性能，高可用和高性性是有沖突的。軟件設(shè)計從來都是取舍Trade-Off。

另外，Write Back實現(xiàn)邏輯比較復(fù)雜，因為他需要track有哪數(shù)據(jù)是被更新了的，需要刷到持久層上。操作系統(tǒng)的write back會在僅當(dāng)這個cache需要失效的時候，才會被真正持久起來，比如，內(nèi)存不夠了，或是進(jìn)程退出了等情況，這又叫l(wèi)azy write。

在wikipedia上有一張write back的流程圖，基本邏輯如下：

Java緩存更新的原理是什么

再多嘮叨一些

1）上面講的這些Design Pattern，其實并不是軟件架構(gòu)里的mysql數(shù)據(jù)庫和memcache/redis的更新策略，這些東西都是計算機(jī)體系結(jié)構(gòu)里的設(shè)計，比如CPU的緩存，硬盤文件系統(tǒng)中的緩存，硬盤上的緩存，數(shù)據(jù)庫中的緩存。基本上來說，這些緩存更新的設(shè)計模式都是非常老古董的，而且歷經(jīng)長時間考驗的策略，所以這也就是，工程學(xué)上所謂的Best Practice，遵從就好了。

2）有時候，我們覺得能做宏觀的系統(tǒng)架構(gòu)的人一定是很有經(jīng)驗的，其實，宏觀系統(tǒng)架構(gòu)中的很多設(shè)計都來源于這些微觀的東西。比如，云計算中的很多虛擬化技術(shù)的原理，和傳統(tǒng)的虛擬內(nèi)存不是很像么？Unix下的那些I/O模型，也放大到了架構(gòu)里的同步異步的模型，還有Unix發(fā)明的管道不就是數(shù)據(jù)流式計算架構(gòu)嗎？TCP的好些設(shè)計也用在不同系統(tǒng)間的通訊中，仔細(xì)看看這些微觀層面，你會發(fā)現(xiàn)有很多設(shè)計都非常精妙……所以，請允許我在這里放句觀點鮮明的話——如果你要做好架構(gòu)，首先你得把計算機(jī)體系結(jié)構(gòu)以及很多老古董的基礎(chǔ)技術(shù)吃透了。

3）在軟件開發(fā)或設(shè)計中，我非常建議在之前先去參考一下已有的設(shè)計和思路，看看相應(yīng)的guideline，best practice或design pattern，吃透了已有的這些東西，再決定是否要重新發(fā)明輪子。千萬不要似是而非地，想當(dāng)然的做軟件設(shè)計。

4）上面，我們沒有考慮緩存（Cache）和持久層（Repository）的整體事務(wù)的問題。比如，更新Cache成功，更新數(shù)據(jù)庫失敗了怎么嗎？或是反過來。關(guān)于這個事，如果你需要強(qiáng)一致性，你需要使用“兩階段提交協(xié)議”——prepare, commit/rollback，比如Java 7 的 XAResource，還有MySQL 5.7的 XA Transaction，有些cache也支持XA，比如 EhCache。當(dāng)然，XA這樣的強(qiáng)一致性的玩法會導(dǎo)致性能下降，關(guān)于分布式的事務(wù)的相關(guān)話題，你可以看看《分布式系統(tǒng)的事務(wù)處理》一文。

到此，關(guān)于“Java緩存更新的原理是什么”的學(xué)習(xí)就結(jié)束了，希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學(xué)習(xí)，快去試試吧！若想繼續(xù)學(xué)習(xí)更多相關(guān)知識，請繼續(xù)關(guān)注億速云網(wǎng)站，小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
BeagleBone Black設(shè)備如何連接
下一篇新聞：
Spring Boot使用注解集成Redis緩存的方法是什么

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼