您好,登錄后才能下訂單哦!
PXC簡介:
galera產(chǎn)品是以galera cluster方式為mysql提高高可用集群解決方案的。galera cluster就是集成了galera插件的mysql集群。galera replication是codership提供的mysql數(shù)據(jù)同步方案,具有高可用性,方便擴展,并且可以實現(xiàn)多個mysql節(jié)點間的數(shù)據(jù)同步復制與讀寫,可保障數(shù)據(jù)庫的服務(wù)高可用及數(shù)據(jù)強一致性。
PXC屬于一套近乎完美的mysql高可用集群解決方案,相比那些比較傳統(tǒng)的基于主從復制模式的集群架構(gòu)MHA和MM+keepalived,galera cluster最突出特點就是解決了詬病已久的數(shù)據(jù)復制延遲問題,基本上可以達到實時同步。而且節(jié)點與節(jié)點之間,他們相互的關(guān)系是對等的。本身galera cluster也是一種多主架構(gòu)。galera cluster最關(guān)注的是數(shù)據(jù)的一致性,對待事物的行為時,要么在所有節(jié)點上執(zhí)行,要么都不執(zhí)行,它的實現(xiàn)機制決定了它對待一致性的行為非常嚴格,這也能非常完美的保證MySQL集群的數(shù)據(jù)一致性;
對galera cluster的封裝有兩個,雖然名稱不同,但實質(zhì)都是一樣的,使用的都是galera cluster。一個MySQL的創(chuàng)始人在自己全新的MariaDB上實現(xiàn)的MAriaDB cluster;一個是著名的MySQL服務(wù)和工具提供商percona實現(xiàn)的percona xtradb cluster,簡稱PXC
要搭建PXC架構(gòu)至少需要3個mysql實例來組成一個集群,三個實例之間不是主從模式,而是各自為主,所以三者是對等關(guān)系,不分從屬,這就叫multi-master架構(gòu)??蛻舳藢懭牒妥x取數(shù)據(jù)時,連接哪個實例都是一樣的。讀取到的數(shù)據(jù)時相同的,寫入任意一個實例之后,集群自己會將新寫入的數(shù)據(jù)同步到其他實例上,這種架構(gòu)不共享任何數(shù)據(jù),是一種高冗余架構(gòu)。
--:galera cluster的功能有7點,如下:
①:多主架構(gòu):真正的多點讀寫集群,在任何時候讀寫的數(shù)據(jù)都是最新的;
②:同步復制:集群不同節(jié)點之間的數(shù)據(jù)同步,沒有延遲,在數(shù)據(jù)庫掛掉之后,數(shù)據(jù)不會丟失;
③:并發(fā)復制:從節(jié)點在apply數(shù)據(jù)時,支持并行執(zhí)行,有更好的性能表現(xiàn)
④:故障切換:因為支持多點寫入,所以在出現(xiàn)數(shù)據(jù)庫故障時可以很容易的進行故障切換
⑤:熱插拔:在服務(wù)期間,如果數(shù)據(jù)庫掛了,只要監(jiān)控程序發(fā)現(xiàn)的夠快,不可服務(wù)時間就會非常少,在節(jié)點故障期間,節(jié)點本身對集群的影響非常??;
⑥:自動節(jié)點克隆:在新增節(jié)點或停機維護時,增量數(shù)據(jù)或基礎(chǔ)數(shù)據(jù)不需要人工手動備份提供,galera cluster會自動拉取在線節(jié)點數(shù)據(jù),集群最終會變?yōu)橐恢拢?/p>
⑦:對應用透明:集群的維護,對應用程序是透明的,幾乎感覺不到;
--PXC原理:
PXC最常使用以下4個端口號:
3306-數(shù)據(jù)庫對外服務(wù)的端口號。
4444-請求SST的端口(SST是指數(shù)據(jù)庫一個備份全量文件的傳輸。)
4567-組成員之間進行溝通的一個端口號
4568-用于傳輸IST(相對于SST來說的一個增量)
PXC的操作流程:
首先客戶端先發(fā)起一個事務(wù),該事務(wù)先在本地執(zhí)行,執(zhí)行完成之后就要發(fā)起對事務(wù)的提交操作了。在提交之前需要將產(chǎn)生的復制寫集廣播出去,然后獲取到一個全局的事務(wù)ID號,一并傳送到另一個節(jié)點上面。通過合并數(shù)據(jù)之后,發(fā)現(xiàn)沒有沖突數(shù)據(jù),執(zhí)行apply_cd和commit_cb動作,否則就需要取消此次事務(wù)的操作。而當前server節(jié)點通過驗證之后,執(zhí)行提交操作,并返回OK,如果驗證沒通過,則執(zhí)行回滾。當然在生產(chǎn)中至少要有3個節(jié)點的集群環(huán)境,如果其中一個節(jié)點沒有驗證通過,出現(xiàn)了數(shù)據(jù)沖突,那么此時采取的方式就是講出現(xiàn)不一致的節(jié)點踢出集群環(huán)境,而且它自己會執(zhí)行shutdown命令,自動關(guān)機。
PXC的優(yōu)點:
①:實現(xiàn)mysql數(shù)據(jù)庫集群架構(gòu)的高可用性和數(shù)據(jù)的 強一致性。
②:完成了真正的多節(jié)點讀寫的集群方案。
③:改善了傳統(tǒng)意義上的主從復制延遲問題,基本上達到了實時同步。
④:新加入的節(jié)點可以自動部署,無須提供手動備份,維護起來很方便。
⑤:由于是多節(jié)點寫入,所以數(shù)據(jù)庫故障切換很容易。
PXC的缺點:
①:新加入的節(jié)點開銷大,需要復制完整的數(shù)據(jù)。采用SST傳輸開銷太大。
②:任何更新事務(wù)都需要全局驗證通過,才會在每個節(jié)點庫上執(zhí)行。集群性能受限于性能最差的節(jié)點,也就是經(jīng)常說的短板效應。
③:因為需要保證數(shù)據(jù)的一致性,所以在多節(jié)點并發(fā)寫時,鎖沖突問題比較嚴重。
④:存在寫擴大問題,所有的節(jié)點上都會發(fā)生些操作。
⑤:只支持innodb存儲引擎的表。
⑥:沒有表級別的鎖定,執(zhí)行DDL語句操作會把整個集群鎖住,而且也 kill 不了(建議使用Osc操作,即在線DDL)
⑦:所有的表必須含有主鍵,不然操作數(shù)據(jù)時會報錯。
PXC搭建的注意點:
首先要規(guī)范集群中節(jié)點的數(shù)量,整個集群中節(jié)點數(shù)控制在最少3個、最多8個范圍內(nèi)。最少3個節(jié)點是為了防止出現(xiàn)腦裂現(xiàn)象,因為只有在兩個節(jié)點下才會出現(xiàn)此現(xiàn)象。腦裂現(xiàn)象的標志就是輸入任何命令、返回結(jié)果都是unkown command,節(jié)點在集群中,會因為新節(jié)點的加入或者故障,同步失效等而發(fā)生狀態(tài)的切換。
--節(jié)點狀態(tài)變化階段:
open:節(jié)點啟動成功,嘗試連接到集群。
primary:節(jié)點已處于集群中,在新節(jié)點加入時,選取donor進行數(shù)據(jù)同步時會產(chǎn)生的狀態(tài)。
joiner:節(jié)點處于等待接收同步文件時的狀態(tài)。
joined:節(jié)點完成數(shù)據(jù)同步的工作,嘗試保持和集群進度一致。
synced:節(jié)點正常提供服務(wù)的狀態(tài),表示已經(jīng)同步完成并和集群進度保持一致。
doner:節(jié)點處于為新加入的節(jié)點提供全量數(shù)據(jù)時的狀態(tài)。
注意:doner節(jié)點就是數(shù)據(jù)的貢獻者,如果一個新節(jié)點加入集群,此時又需要大量數(shù)據(jù)的SST傳輸,就有可能因此而拖垮整個集群的性能。所以在生產(chǎn)環(huán)境中,如果數(shù)據(jù)量小,還可以使用SST全量傳輸,但如果數(shù)據(jù)量很大就不建議使用這種方式了??梢钥紤]先建立主從關(guān)系,在加入集群。
PXC有兩種節(jié)點的數(shù)據(jù)傳輸方式:一種叫SST全量傳輸,另一種叫IST增量傳輸。
SST傳輸有:xtrabackup、mysqldump和rsync三種方法。而增量傳輸就一種方法就是xtrabackup。但生產(chǎn)環(huán)境中一般數(shù)據(jù)量不大的時候,可以使用SST全量傳輸,但也只實現(xiàn)xtrabackup方法。
在PXC中還有一個特別重要的模塊就是GCache。它的核心功能就是每個節(jié)點緩存當前最新的寫集。如果有新節(jié)點加入進來,就可以把新數(shù)據(jù)的增量傳遞給新節(jié)點,而不需要再使用SST方式了。這樣可以讓節(jié)點更快地加入集群中。涉及參數(shù)如下:
gcache.size:代表用來緩存寫集增量信息的大小。它的默認大小是128MB,通過wsrep_provider_options參數(shù)設(shè)置。建議調(diào)整為2GB-4GB范圍,足夠的空間便于緩存更多的增量信息。
gcache.mem_size:代表gcache中內(nèi)存緩存的大小,適度調(diào)大可以提高整個集群的性能。
gcache.page_size:可以理解為如果內(nèi)存不夠用(gcache不足),就直接將寫集寫入磁盤文件中。
--:PXC的工作模式:
galera的工作模式是——某個節(jié)點寫入一個事務(wù),它會廣播到其他節(jié)點,而這個所謂的其他節(jié)點,也包括自己。也就說自己發(fā)出來的事務(wù),自己也會收到,只是在收到并產(chǎn)生GTID之后,就被簡單忽略了,而不會再去apply一次。
--:galera的并發(fā)控制機制:
并發(fā)控制主要是在接口galera_pre_commit中完成的,這個接口是galera最重要的接口之一,這里面實現(xiàn)了最重要的復制、驗證邏輯。目前,這個接口中包括的并發(fā)控制有以下幾點:
①:數(shù)據(jù)復制:
目前的galera版本中,寫集數(shù)據(jù)的發(fā)送是通過asio的異步方式將數(shù)據(jù)廣播出去。這個發(fā)送是串行的,是一個臨界區(qū),因為在每次 發(fā)送前,邏輯上還需要分片,并且每次發(fā)送完成之后,需要等待一個GTID的值,所以為了保證數(shù)據(jù)的一致性,這個發(fā)送操作需要串行;
②:寫集驗證:
要求所有進入處理區(qū)的GTID必須是順序的,因為GTID是順序產(chǎn)生的,所以在順序的基礎(chǔ)上,同一時間必須只有一個事務(wù)可以進行處理,說白了就是串行;
受這種層次并發(fā)控制管理的操作主要有驗證操作,因此說驗證是串行的;
③:寫集apply
④:事務(wù)commit
這個層次的并發(fā)控制機制,默認是3,建議也是3,就是串行提交,這樣就保證了不管在主庫還是從庫,所有的節(jié)點產(chǎn)生的binlog都是完全相同的;
3、galera 接口:
---galera_init:
這個接口的作用是初始化一個galera節(jié)點,這是一個PXC節(jié)點調(diào)用的第一個wsrep接口,在啟動服務(wù)器的時候初始化,將所有需要的參數(shù)和環(huán)境變量初始化。(如:集群名字,實例地址、需要這個接口做binlog的復制等)
---galera_connect:
這個接口是第二個調(diào)用的接口。這個接口的作用是將當前節(jié)點加入集群中。加入集群前會調(diào)用函數(shù)wsrep_view_handler_cb來判斷新加入節(jié)點與集群的數(shù)據(jù)是否同步;
---galera_recv:
這個接口的作用是,在這個函數(shù)里阻塞式的接收其他節(jié)點及本節(jié)點發(fā)送的數(shù)據(jù),并且調(diào)用復制apply函數(shù)執(zhí)行復制操作。(這個接口實際上是可以并行存在的。它對應的是參數(shù)wsrep_slave_threads有多少個線程,就有多少個galera_recv的調(diào)用)
---galera_pre_commit:
這個接口是galera最重要的接口之一。它的作用包括兩部分,首先是將當前指定的事務(wù)寫集廣播給整個集群節(jié)點,然后就是驗證,如果驗證成功,則將處理權(quán)交給上層,繼續(xù)做數(shù)據(jù)庫事務(wù)的提交操作;這個接口是在數(shù)據(jù)庫事務(wù)提交時調(diào)用的,調(diào)用這個接口時,必須是本地事務(wù)已經(jīng)執(zhí)行完成;
---galera_replay_trx:
這個接口的作用及使用,就是在驗證過程中,由于數(shù)據(jù)庫鎖的沖突,當前操作被其他線程自治縣了galera_abort_pre_com_mit,導致當前線程被強制中止,但是由于寫集已經(jīng)復制到其他節(jié)點,所以本節(jié)點這個事務(wù)必須要完成。通過這個接口,將這個事務(wù)的寫集做一次apply,所以就叫replay;
---galera_append_key:
這個接口就是所謂的galera驗證,被驗證的對象實際上就是寫集,而構(gòu)成寫集的內(nèi)容,其實就是通過這個接口來完成的;
---galera_append_data:
這個接口是當前事務(wù)所生成的binlog內(nèi)容,也就是說key在驗證通過之后,使用data在從節(jié)點執(zhí)行,即可做到數(shù)據(jù)同步;
---galera_post_commit:
這個接口是用來真正提交事務(wù)的。這個接口包括4個功能:更新狀態(tài)參數(shù)wsrep_last_committed的值,表示當前事務(wù)已經(jīng)真正提交了;更新參數(shù)wsrep_local_commits的值,表示本地又成功提交了一個事務(wù);檢查當前驗證寫集緩沖區(qū)是不是可以做purge操作;
---galera_to_execute_start:
這個接口專門用來處理DDL語句的執(zhí)行;
---galera_to_execute_end:
這個接口實際上和galera_post_commit功能一樣,成對出現(xiàn),是為處理不同語句而設(shè)置的,主要就是為了從commit臨界區(qū)中出來,從而讓其他事務(wù)繼續(xù)提交;
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。