溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

發(fā)布時間:2020-07-10 09:13:12 來源:網(wǎng)絡(luò) 閱讀:714 作者:若小寒 欄目:編程語言

目錄

  1. 前言
  2. 為什么產(chǎn)生數(shù)據(jù)不一致
  3. 方案一:利用數(shù)據(jù)庫自身特性
  4. 方案二:不解決
  5. 方案三:客戶端保存法
  6. 方案四:緩存標(biāo)記法
  7. 方案五:本地緩存標(biāo)記

前言

在互聯(lián)網(wǎng)中大型項目中,讀寫分離應(yīng)該是我們小伙伴經(jīng)常聽說的,這個主要解決大流量請求時,提高系統(tǒng)的吞吐量。因為絕大部分互聯(lián)網(wǎng)產(chǎn)品都是讀多寫少,大部分都是讀請求,很小部分是寫請求。

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

上圖:

1.一個主庫負責(zé)寫請求,更新數(shù)據(jù)
2.兩個從庫負責(zé)讀請求,可以提高系統(tǒng)吞吐量
3.主庫和從庫之間同步數(shù)據(jù)

為什么產(chǎn)生數(shù)據(jù)不一致

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

上圖中業(yè)務(wù)流程

1.寫請求A進行數(shù)據(jù)更新,但寫庫還沒有來得及把更新的數(shù)據(jù)更新到讀庫
2.讀請求B進行數(shù)據(jù)查詢,請求B是訪問的讀庫,獲取的是舊值
3.因為寫庫和讀庫之間存在同步延遲,導(dǎo)致數(shù)據(jù)在不同庫中不一致

這個問題我們?nèi)绾谓鉀Q?

方案一:利用數(shù)據(jù)庫自身特性

我們一般用的數(shù)據(jù)庫是mysql和oracle,mysql是我們互聯(lián)網(wǎng)項目都會用到的,oracle一般大公司用的比較多(很貴?。?/p>

我們分析一下問題,原因就是在主庫(寫庫)與從庫(讀庫)之間數(shù)據(jù)同步延遲導(dǎo)致,mysql中有全同步復(fù)制機制、半同步復(fù)制、異步復(fù)制三種復(fù)制方案(小伙伴可以自行去了解)。

mysql全同步復(fù)制

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

全同步復(fù)制,當(dāng)A提交更新請求主庫事務(wù)之后,不是立即返回,而是等到所有的從庫節(jié)點必須收到、APPLY并且提交這些事務(wù),主庫線程才返回請求A結(jié)果,才能做后續(xù)操作。這樣就解決了數(shù)據(jù)同步延遲的問題。

問題:但這個同步方案嚴重的問題就是寫請求耗時會很長,而且會隨者從庫數(shù)量增加,耗時也會增加。(不推薦)

oracle共享存儲

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

上圖采用了oracle RAC方案,DB服務(wù)其實就代表一個應(yīng)用服務(wù),所有的數(shù)據(jù)存儲在同一個地方,所有就不存在數(shù)據(jù)同步這個問題。當(dāng)然這個部署方案不是我們嚴格意義上面的讀寫分離,存儲是獨立的。

問題:oracle成本很高,對存儲硬件要求很高。

方案二:不解決

我們設(shè)計任何架構(gòu)方案,都要圍繞著業(yè)務(wù),如果業(yè)務(wù)能夠接受可以不解決;其實很多互聯(lián)網(wǎng)產(chǎn)品都有短時間的數(shù)據(jù)不一致問題。如:58同城,美團,貼吧等。

但有些場景是不允許的。如:

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

上圖中:

1.用戶寫了一篇文章,點擊保存按鈕
2.系統(tǒng)執(zhí)行保存方法,提示用戶保存成功
3.保存成功后一般系統(tǒng)就會立即跳轉(zhuǎn)到文章列表,按照時間倒序,最新的文章排在第一個,這個業(yè)務(wù)是很正常的,讓用戶可以看到自己的文章列表(我們的頭條號就是這樣的)
4.這樣就是調(diào)用獲取文章列表的方法getArticleList,但這個方法是讀請求,走的是從庫。
5.如果出現(xiàn)主庫和從庫同步延遲,就出現(xiàn)了不一致。

這樣用戶就看不到他剛剛提交保存的文章,這個用戶是接受不了的。那我們怎么解決?

方案三:客戶端保存法

這個方案是從一個朋友公司用到的,老顧沒有采用過。一些業(yè)務(wù)的操作是有前端頁面的,不管是網(wǎng)頁或App等。此方案的思路就是把之前保存的文章緩存到客戶端,在用戶到文章列表時,數(shù)據(jù)的組成就是(客戶端緩存文章 + 后端讀庫返回的文章數(shù)據(jù))??蛻舳艘龅木褪蔷彺嬉O(shè)置一個時間(這個緩存時間,可以預(yù)估主庫同步到從庫的時間延遲);以及要做文章去重,防止讀庫已經(jīng)同步完成,客戶端緩存沒有過期。

問題:客戶端邏輯復(fù)雜;客戶端有緩存數(shù)據(jù)大小的限制,不能保存大數(shù)據(jù)。列表分頁處理復(fù)雜。

方案四:緩存標(biāo)記法

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

上圖流程:

1.A發(fā)起寫請求,更新了主庫,但在緩存中設(shè)置一個標(biāo)記,代表此數(shù)據(jù)已經(jīng)更新,標(biāo)記格式(業(yè)務(wù)代號:數(shù)據(jù)庫:表:主鍵ID)根據(jù)自己業(yè)務(wù)場景。
2.設(shè)置此標(biāo)記,要加上過期時間,可以為預(yù)估的主庫和從庫同步延遲的時間.
3.B發(fā)起讀請求的時候,先判斷此請求的業(yè)務(wù)在緩存中有沒有更新標(biāo)記
4.如果存在標(biāo)記,走主庫;如果沒有走從庫。

這個方案就有效了解決了數(shù)據(jù)不一致的問題。

但這個方案會有個嚴重的問題,也就是每次的讀請求都要到緩存中去判斷是否存在緩存標(biāo)記,如果是單機部署用的是jvm緩存,對性能還好;但如果是集群部署緩存肯定用redis,每次讀都要和redis進行交互,這樣肯定會影響系統(tǒng)吞吐量。

那怎么辦?怎么辦?繼續(xù)往下看

方案五:本地緩存標(biāo)記

你知道怎么解決DB讀寫分離,導(dǎo)致數(shù)據(jù)不一致問題嗎?

上圖流程:

1.用戶A發(fā)起寫請求,更新了主庫,并在客戶端設(shè)置標(biāo)記,過期時間,如:cookies
2.用戶A再發(fā)起讀請求時,帶上這個本地標(biāo)記在后端
3.后端在處理請求時,獲取請求傳過來的數(shù)據(jù),看有沒有這個標(biāo)記(如:cookies)
4.有這個業(yè)務(wù)標(biāo)記,走主庫;沒有走從庫。

這個方案就保證了用戶A的讀請求肯定是數(shù)據(jù)一致的,而且沒有性能問題,因為標(biāo)記是本地客戶端傳過去的。

但有寫小伙伴就會問那其他用戶在本地客戶端是沒有這個標(biāo)記的,他們走的就是從庫了。那其他用戶不就看不到這個數(shù)據(jù)了嗎?說的對,其他用戶是看不到,但看不到的時間很短,過個1~10秒就能夠看到。

但這個方案解決了當(dāng)前用戶的數(shù)據(jù)一致性的問題,如上面舉的例子,寫文章,然后到文章列表,本用戶是能夠看到的。其他用戶暫時看不到是沒有關(guān)系的。還是那句話,脫離業(yè)務(wù)的方案是耍流氓。(推薦)

總結(jié):大家應(yīng)該按照自己不同的業(yè)務(wù)場景,選擇不同的方案;方案各有千秋,具體看業(yè)務(wù)場景

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI