你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

發(fā)布時間：2020-07-10 09:13:12 來源：網(wǎng)絡(luò) 閱讀：714 作者：若小寒欄目：編程語言

前言

在互聯(lián)網(wǎng)中大型項目中，讀寫分離應(yīng)該是我們小伙伴經(jīng)常聽說的，這個主要解決大流量請求時，提高系統(tǒng)的吞吐量。因為絕大部分互聯(lián)網(wǎng)產(chǎn)品都是讀多寫少，大部分都是讀請求，很小部分是寫請求。

上圖：

1.一個主庫負責(zé)寫請求，更新數(shù)據(jù)
2.兩個從庫負責(zé)讀請求，可以提高系統(tǒng)吞吐量
3.主庫和從庫之間同步數(shù)據(jù)

為什么產(chǎn)生數(shù)據(jù)不一致

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

上圖中業(yè)務(wù)流程

1.寫請求A進行數(shù)據(jù)更新，但寫庫還沒有來得及把更新的數(shù)據(jù)更新到讀庫
2.讀請求B進行數(shù)據(jù)查詢，請求B是訪問的讀庫，獲取的是舊值
3.因為寫庫和讀庫之間存在同步延遲，導(dǎo)致數(shù)據(jù)在不同庫中不一致

這個問題我們?nèi)绾谓鉀Q？

方案一：利用數(shù)據(jù)庫自身特性

我們一般用的數(shù)據(jù)庫是mysql和oracle，mysql是我們互聯(lián)網(wǎng)項目都會用到的，oracle一般大公司用的比較多（很貴?。?/p>

我們分析一下問題，原因就是在主庫（寫庫）與從庫（讀庫）之間數(shù)據(jù)同步延遲導(dǎo)致，mysql中有全同步復(fù)制機制、半同步復(fù)制、異步復(fù)制三種復(fù)制方案（小伙伴可以自行去了解）。

mysql全同步復(fù)制

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

全同步復(fù)制，當(dāng)A提交更新請求主庫事務(wù)之后，不是立即返回，而是等到所有的從庫節(jié)點必須收到、APPLY并且提交這些事務(wù)，主庫線程才返回請求A結(jié)果，才能做后續(xù)操作。這樣就解決了數(shù)據(jù)同步延遲的問題。

問題：但這個同步方案嚴重的問題就是寫請求耗時會很長，而且會隨者從庫數(shù)量增加，耗時也會增加。（不推薦）

oracle共享存儲

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

上圖采用了oracle RAC方案，DB服務(wù)其實就代表一個應(yīng)用服務(wù)，所有的數(shù)據(jù)存儲在同一個地方，所有就不存在數(shù)據(jù)同步這個問題。當(dāng)然這個部署方案不是我們嚴格意義上面的讀寫分離，存儲是獨立的。

問題：oracle成本很高，對存儲硬件要求很高。

方案二：不解決

我們設(shè)計任何架構(gòu)方案，都要圍繞著業(yè)務(wù)，如果業(yè)務(wù)能夠接受可以不解決；其實很多互聯(lián)網(wǎng)產(chǎn)品都有短時間的數(shù)據(jù)不一致問題。如：58同城，美團，貼吧等。

但有些場景是不允許的。如：

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

上圖中：

1.用戶寫了一篇文章，點擊保存按鈕
2.系統(tǒng)執(zhí)行保存方法，提示用戶保存成功
3.保存成功后一般系統(tǒng)就會立即跳轉(zhuǎn)到文章列表，按照時間倒序，最新的文章排在第一個，這個業(yè)務(wù)是很正常的，讓用戶可以看到自己的文章列表（我們的頭條號就是這樣的）
4.這樣就是調(diào)用獲取文章列表的方法getArticleList，但這個方法是讀請求，走的是從庫。
5.如果出現(xiàn)主庫和從庫同步延遲，就出現(xiàn)了不一致。

這樣用戶就看不到他剛剛提交保存的文章，這個用戶是接受不了的。那我們怎么解決？

方案三：客戶端保存法

這個方案是從一個朋友公司用到的，老顧沒有采用過。一些業(yè)務(wù)的操作是有前端頁面的，不管是網(wǎng)頁或App等。此方案的思路就是把之前保存的文章緩存到客戶端，在用戶到文章列表時，數(shù)據(jù)的組成就是（客戶端緩存文章 + 后端讀庫返回的文章數(shù)據(jù)）?？蛻舳艘龅木褪蔷彺嬉O(shè)置一個時間（這個緩存時間，可以預(yù)估主庫同步到從庫的時間延遲）；以及要做文章去重，防止讀庫已經(jīng)同步完成，客戶端緩存沒有過期。

問題：客戶端邏輯復(fù)雜；客戶端有緩存數(shù)據(jù)大小的限制，不能保存大數(shù)據(jù)。列表分頁處理復(fù)雜。

方案四：緩存標(biāo)記法

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

上圖流程：

1.A發(fā)起寫請求，更新了主庫，但在緩存中設(shè)置一個標(biāo)記，代表此數(shù)據(jù)已經(jīng)更新，標(biāo)記格式（業(yè)務(wù)代號：數(shù)據(jù)庫：表：主鍵ID）根據(jù)自己業(yè)務(wù)場景。
2.設(shè)置此標(biāo)記，要加上過期時間，可以為預(yù)估的主庫和從庫同步延遲的時間.
3.B發(fā)起讀請求的時候，先判斷此請求的業(yè)務(wù)在緩存中有沒有更新標(biāo)記
4.如果存在標(biāo)記，走主庫；如果沒有走從庫。

這個方案就有效了解決了數(shù)據(jù)不一致的問題。

但這個方案會有個嚴重的問題，也就是每次的讀請求都要到緩存中去判斷是否存在緩存標(biāo)記，如果是單機部署用的是jvm緩存，對性能還好；但如果是集群部署緩存肯定用redis，每次讀都要和redis進行交互，這樣肯定會影響系統(tǒng)吞吐量。

那怎么辦？怎么辦？繼續(xù)往下看

方案五：本地緩存標(biāo)記

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

上圖流程：

1.用戶A發(fā)起寫請求，更新了主庫，并在客戶端設(shè)置標(biāo)記，過期時間，如：cookies
2.用戶A再發(fā)起讀請求時，帶上這個本地標(biāo)記在后端
3.后端在處理請求時，獲取請求傳過來的數(shù)據(jù)，看有沒有這個標(biāo)記（如：cookies）
4.有這個業(yè)務(wù)標(biāo)記，走主庫；沒有走從庫。

這個方案就保證了用戶A的讀請求肯定是數(shù)據(jù)一致的，而且沒有性能問題，因為標(biāo)記是本地客戶端傳過去的。

但有寫小伙伴就會問那其他用戶在本地客戶端是沒有這個標(biāo)記的，他們走的就是從庫了。那其他用戶不就看不到這個數(shù)據(jù)了嗎？說的對，其他用戶是看不到，但看不到的時間很短，過個1～10秒就能夠看到。

但這個方案解決了當(dāng)前用戶的數(shù)據(jù)一致性的問題，如上面舉的例子，寫文章，然后到文章列表，本用戶是能夠看到的。其他用戶暫時看不到是沒有關(guān)系的。還是那句話，脫離業(yè)務(wù)的方案是耍流氓。（推薦）

總結(jié)：大家應(yīng)該按照自己不同的業(yè)務(wù)場景，選擇不同的方案；方案各有千秋，具體看業(yè)務(wù)場景

向AI問一下細節(jié)

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

目錄

前言

為什么產(chǎn)生數(shù)據(jù)不一致

方案一：利用數(shù)據(jù)庫自身特性

方案二：不解決

方案三：客戶端保存法

方案四：緩存標(biāo)記法

方案五：本地緩存標(biāo)記

猜你喜歡

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？

目錄

前言

為什么產(chǎn)生數(shù)據(jù)不一致

方案一：利用數(shù)據(jù)庫自身特性

方案二：不解決

方案三：客戶端保存法

方案四：緩存標(biāo)記法

方案五：本地緩存標(biāo)記

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

你知道怎么解決DB讀寫分離，導(dǎo)致數(shù)據(jù)不一致問題嗎？