溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Zookeeper詳解(一):分布式與Zookeeper

發(fā)布時間:2020-07-06 21:41:38 來源:網(wǎng)絡(luò) 閱讀:1885 作者:linuxjavachen 欄目:建站服務(wù)器

分布式

在分布式框架中,分布式應(yīng)用面臨的最大的問題就是數(shù)據(jù)一致性。那么Zookeeper就是一個比較好的解決方案。在分布式框架中起到協(xié)調(diào)作用。


什么是Zookeeper

zookeeper是高性能的分布式協(xié)作服務(wù)和分布式數(shù)據(jù)一致性解決方案,由雅虎創(chuàng)建,是Goole Chubby的開源實現(xiàn),所以你就自然明白Zookeeper和Chubby的關(guān)系了。Chubby是一個分布式鎖服務(wù),GFS和Big Table都是用它來解決分布式協(xié)作的一些問題,其底層一致性實現(xiàn)就是以Paxos算法為基礎(chǔ)的。

zookeeper可以保證分布式一致性特性,包括順序一致性、原子性、單一視圖(無論客戶端連接哪一個ZK服務(wù)器看到的都是一樣的數(shù)據(jù)模型)、可靠性、實時性(在一定時間內(nèi)客戶端可以讀取到最新數(shù)據(jù)狀態(tài)而不是提交后所有服務(wù)器馬上就全部更新。)

zookeeper的數(shù)據(jù)模型是一個樹形節(jié)點,服務(wù)啟動后,所有數(shù)據(jù)加載到內(nèi)存中這樣來提高服務(wù)器吞吐并減少延遲。


Zookeeper的基本概念

集群角色:

  • Leader:ZK集群的核心角色,通過選舉產(chǎn)生,為客戶端提供讀寫服務(wù),也就是處理事務(wù)請求

  • Follower:集群狀態(tài)的跟隨者,參加選舉,沒有被選上就是這個角色,提供讀取服務(wù),也就是處理非事務(wù)請求,對于收到的事務(wù)請求會轉(zhuǎn)發(fā)給Leader服務(wù)器

  • Observer:觀察者角色,不參加選舉,但是提供數(shù)據(jù)讀取服務(wù),提供讀取服務(wù),也就是處理非事務(wù)請求,對于收到的事務(wù)請求會轉(zhuǎn)發(fā)給Leader服務(wù)器


會話:

客戶端和ZK的連接,客戶端與ZK連接一個TCP的長連接來維持會話,通過這個連接可以檢測心跳與服務(wù)器保存會話,也可以發(fā)送請求并接受服務(wù)器響應(yīng),也可以接受WATCH事件。

數(shù)據(jù)節(jié)點:

節(jié)點有兩類

  • 集群中的一臺機器就叫做一個節(jié)點

  • 還有就是樹形數(shù)據(jù)單元中的Znode也叫一個節(jié)點,有持久節(jié)點和臨時節(jié)點

版本:

ZK的版本和我們常規(guī)理解的版本不太一樣,它是記錄節(jié)點數(shù)據(jù)或者節(jié)點子節(jié)點的類別或者ACL的修改次數(shù)。有一個叫做STAT的數(shù)據(jù)結(jié)構(gòu)這里面就記錄了下面的版本信息。

  • version:當前數(shù)據(jù)節(jié)點數(shù)據(jù)內(nèi)容的版本號

  • cversion:當前數(shù)據(jù)節(jié)點子節(jié)點的版本號

  • aversion:當前數(shù)據(jù)節(jié)點ACL變更版本號


可以利用這個版本實現(xiàn)分布式的鎖服務(wù)

悲觀鎖:悲觀并發(fā)鎖,也叫做排他鎖,避免不同事務(wù)對對同一數(shù)據(jù)并發(fā)更新操作數(shù)據(jù)不一致

樂觀鎖:認為不同事務(wù)訪問相同數(shù)據(jù)很少出現(xiàn)相互干擾的情況,所以不需要做嚴格的并發(fā)控制,但是它也是鎖。比如對每個數(shù)據(jù)庫表增加一個版本號,修改數(shù)據(jù)之前讀取數(shù)據(jù)自然也會把版本號讀取出來,更新的時候就使用這個版本號,如果版本號為1,更新的時候就使用1,如果更新失敗則表示其他事物已經(jīng)對數(shù)據(jù)做了修改,這時候就需要其他后續(xù)處理。


watcher:

ZK允許用戶在節(jié)點上注冊watcher,當數(shù)據(jù)發(fā)生變化時,ZK會把這個變化通知發(fā)送給客戶端。


ACL權(quán)限控制:

可以對節(jié)點設(shè)置權(quán)限控制

  • CREATE:創(chuàng)建子節(jié)點的讀權(quán)限

  • READ:獲取節(jié)點數(shù)據(jù)和子節(jié)點列表的權(quán)限

  • WRITE:更新節(jié)點數(shù)據(jù)的權(quán)限

  • DELET:刪除子節(jié)點的權(quán)限

  • ADMIN:設(shè)置節(jié)點ACL的權(quán)限


ZAB協(xié)議

zookeeper是基于PAXOS算法,但是它自己也有一套核心算法就是ZAB,原子消息廣播協(xié)議。這個協(xié)議是為Zookeeper單獨設(shè)計的,是崩潰可恢復的的原子消息廣播算法。

Zookeeper使用一個單一的主進程來接收并處理客戶端所有請求,將服務(wù)器的狀態(tài)以事務(wù)的形式廣播到所有副本進程中。


ZAB協(xié)議包括兩種基本模式,崩潰恢復和消息廣播。

集群啟動過程中,Leader斷開、崩潰退出或重啟等異常情況,ZAB會進入恢復模式并選舉新的Leader,當產(chǎn)生了新的Leader后并集群中過半腐惡去完成了與Leader的狀態(tài)同步(數(shù)據(jù)同步),那么ZAB協(xié)議退出恢復模式,進入消息廣播模式。

如果在當前集群中新加入一臺服務(wù)器,那么這臺新服務(wù)器會自動進入恢復模式,待完成與集群Leader的同步之后就進入消息廣播模式。


Leader服務(wù)器收到客戶端的事務(wù)請求會生成一個事務(wù)提案并發(fā)起廣播;如果非Leader服務(wù)器收到客戶端請求后它會把請求轉(zhuǎn)發(fā)給Leader服務(wù)器。


消息廣播:

在廣播事務(wù)之前Leader服務(wù)器會先給這個事務(wù)分配一個全局單調(diào)遞增的唯一ID,也就是事務(wù)ID(ZXID),每一個事務(wù)必須按照ZXID的先后順序進行處理。而且Leader服務(wù)器會為每一個Follower分配一個單獨的隊列,然后將需要廣播的事務(wù)放到隊列中。每個Follower服務(wù)器再接收到這個事務(wù)之后,都會將其以事務(wù)日志的形式寫入到本地磁盤中,成功寫入后反饋給Leader一個ACK,當Leader收到半數(shù)ACK響應(yīng)之后,就會廣播一個Commit消息給所有Follower,通知它們進行提交,同時Leader也會完成自身的提交。


崩潰恢復:

其目的就是保證盡快選舉出一個新的Leader并通知給其他Follower,同時保證整個集群中的數(shù)據(jù)狀態(tài)是一致的。

ZAB協(xié)議丟棄那些只有在Leader服務(wù)器被提出的事務(wù)。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI