您好,登錄后才能下訂單哦!
Porter是一款數(shù)據(jù)同步中間件,主要用于解決同構(gòu)/異構(gòu)數(shù)據(jù)庫之間的表級別數(shù)據(jù)同步問題。
在微服務(wù)架構(gòu)模式下深刻的影響了應(yīng)用和數(shù)據(jù)庫之間的關(guān)系,不像傳統(tǒng)多個服務(wù)共享一個數(shù)據(jù)庫,微服務(wù)架構(gòu)下每個服務(wù)都要有自己的數(shù)據(jù)庫。如果你想獲得微服務(wù)帶來的好處,每個服務(wù)獨有一個數(shù)據(jù)庫是必須的,因為微服務(wù)強調(diào)的就是松耦合。我們希望數(shù)據(jù)庫就和服務(wù)一樣,要有充分的獨立性、可以和服務(wù)一起部署、一起擴展、一起重構(gòu)。同時,還需要兼顧數(shù)據(jù)中心的數(shù)據(jù)聚合、DBA的多種數(shù)據(jù)庫備份、報表中心的業(yè)務(wù)報表等等矛盾問題。因此便產(chǎn)生了「Porter」項目。
微服務(wù)改造過程中,無法避免的一個坎,那就是垂直拆庫,根據(jù)不同的子服務(wù),把過去的「一庫多服」拆分成「一庫一服」。
不管是否是微服務(wù)架構(gòu),應(yīng)用的各個模塊之間都需要頻繁的通信、協(xié)作、共享數(shù)據(jù),實現(xiàn)系統(tǒng)的整體價值。區(qū)別點在于單體應(yīng)用是通過本地方法調(diào)用來完成;在微服務(wù)中是通過遠程API調(diào)用完成。
而共享數(shù)據(jù)最賤的方式就是采用共享數(shù)據(jù)庫模式,也就是單體應(yīng)用中最常用的方式,一般只有一個數(shù)據(jù)庫,如圖一庫多服和一庫一服的方式:
一庫多服的架構(gòu)模式通常會被認為是微服務(wù)架構(gòu)下的反范式,它的問題在于:
穩(wěn)定性:單點故障,一個數(shù)據(jù)庫掛掉,整批服務(wù)全部停止。服務(wù)獨立性被扼殺?
耦合性:數(shù)據(jù)在一起,會給貪圖方便的開發(fā)或者DBA工程師編寫很多數(shù)據(jù)間高度依賴的程序或者工具;
擴展性:無法針對某一個服務(wù)進行精準優(yōu)化或擴展,服務(wù)會大體分為兩個讀多寫少、寫多讀少,數(shù)據(jù)庫優(yōu)化是根據(jù)服務(wù)而來的,不是一篇而論。
所以隨行付內(nèi)部一般推薦的做法:是為每一個微服務(wù)準備一個單獨的數(shù)據(jù)庫,即一庫一服模式。這種模式更加適合微服務(wù)架構(gòu),它滿足每一個服務(wù)是獨立開發(fā)、獨立部署、獨立擴展的特性。當(dāng)需要對一個服務(wù)進行升級或者數(shù)據(jù)架構(gòu)改動的時候,無須影響到其他的服務(wù)。需要對某個服務(wù)進行擴展的時候,也可以手術(shù)式的對某一個服務(wù)進行局部擴容。
那么問題來了,在改造中我們發(fā)現(xiàn),以下問題,誕生了該項目:
報表中心和前端詳細頁都存在SQL Join方式,經(jīng)歷我們一庫一服的拆分后,無法在繼續(xù)使用SQL Join方式了...
數(shù)據(jù)中心,做得是數(shù)據(jù)聚合,數(shù)據(jù)拆分后,給數(shù)據(jù)中心帶來了很大的麻煩...
微服務(wù)之后,各個應(yīng)用模塊對數(shù)據(jù)庫的要求出現(xiàn)了分歧,數(shù)據(jù)庫類型多元化自主選擇還是統(tǒng)一...
等等...
Porter是一個集中式的數(shù)據(jù)處理通道,所有的數(shù)據(jù)都在這個數(shù)據(jù)處理平臺匯聚、分發(fā)。Porter是一個無中心、插件友好型分布式數(shù)據(jù)同步中間件。默認注冊中心插件實現(xiàn)為zookeeper, 當(dāng)然,你也可以基于注冊中心接口實現(xiàn)自定義注冊中心模塊。在Porter的主流程外分布著集群插件、源端消費插件、源端消息轉(zhuǎn)換器插件、目標端寫入插件、告警插件、自定義數(shù)據(jù)定義插件等插件模塊,除了集群插件、告警插件是Porter任務(wù)節(jié)點全局作用域外,其余插件模塊都隨著同步任務(wù)的不同而相應(yīng)組合。得益于良好的設(shè)計模式,Porter才能為大家呈現(xiàn)如此靈活的擴展性與易用性。
Porter始于2017年,提供數(shù)據(jù)同步功能,但并不僅僅局限于數(shù)據(jù)同步,在隨行付內(nèi)部廣泛使用。主要提供一下功能:
原生支持Oracle|Mysql到Jdbc關(guān)系型數(shù)據(jù)庫最終一致同步
插件友好化,支持自定義源端消費插件、目標端載入插件、告警插件等插件二次開發(fā)。
支持自定義源端、目標端表、字段映射
支持節(jié)點基于配置文件的同步任務(wù)配置。
支持管理后臺同步任務(wù)推送,節(jié)點、任務(wù)管理。提供任務(wù)運行指標監(jiān)控,節(jié)點運行日志、任務(wù)異常告警。
支持節(jié)點資源限流、分配。
基于Zookeeper集群插件的分布式架構(gòu)。支持自定義集群插件。
Porter節(jié)點通過注冊中心實現(xiàn)分布式集群,并根據(jù)資源需求動態(tài)擴縮容。Portert與注冊中心協(xié)商了一套任務(wù)、節(jié)點、統(tǒng)計接口,Porter節(jié)點通過監(jiān)聽注冊中心接口數(shù)據(jù)的變化實現(xiàn)任務(wù)的分配管理。配置管理后臺遵守并實現(xiàn)注冊中心的接口規(guī)范,實現(xiàn)對Porter節(jié)點遠程管理。注冊中心同樣有一套分布式鎖機制,用于任務(wù)資源的分配。
在這個機制外,Porter節(jié)點可以通過本地配置文件的方式實現(xiàn)任務(wù)的定義。
1、基于Canal開源產(chǎn)品,獲取MySql數(shù)據(jù)庫增量日志數(shù)據(jù)。
2、管理系統(tǒng)架構(gòu)。管理節(jié)點(web manager)管理工作節(jié)點任務(wù)編排、數(shù)據(jù)工作節(jié)點(TaskWork)匯報工作進度
3、基于Zookeeper集群插件的分布式架構(gòu)。支持自定義集群插件
4、基于Kafka消息組件,每張表對應(yīng)一個Topic,數(shù)據(jù)節(jié)點分Topic消費工作
為了保證數(shù)據(jù)的一致性,源端數(shù)據(jù)提取與目標端插入采用單線程順序執(zhí)行,中間階段通過多線程執(zhí)行提高數(shù)據(jù)處理速度。對照上圖就是SelectJob與LoadJob單線程執(zhí)行,ExtractJob、TransformJob線程并行執(zhí)行,然后在LoadJob階段對數(shù)據(jù)包進行排序,順序?qū)懭肽繕硕恕?/p>
正如文章開頭所說,告警插件與注冊中心插件在多個任務(wù)間共享,每個任務(wù)根據(jù)源端與目標端的類型、源端數(shù)據(jù)格式選擇與之相匹配的處理插件。也就是說告警插件、注冊中心插件與Porter節(jié)點配置相關(guān),數(shù)據(jù)消費插件、目標端插件、自定義數(shù)據(jù)處理插件等插件與任務(wù)配置相關(guān)。
Porter通過SPI規(guī)范結(jié)合單例、工廠、監(jiān)聽者模式等設(shè)計模式,實現(xiàn)了極大的靈活性與松耦合,滿足不同場景的二次開發(fā)。具體涵蓋如下四個方面的插件化設(shè)計:
注冊中心插件
源端消費插件
目標端載入插件
自定義數(shù)據(jù)處理插件
Porter的集群模式依賴集群插件,默認的集群插件基于zookeeper實現(xiàn)。Porter任務(wù)節(jié)點和管理節(jié)點并不是強制綁定關(guān)系,任務(wù)部署可以通過任務(wù)配置文件,也可以通過管理節(jié)點推送。管理節(jié)點還可以管理節(jié)點、收集、展示監(jiān)控指標信息等,是一個不錯的、簡化運維的管理平臺。同樣的,可以基于zookeeper數(shù)據(jù)結(jié)構(gòu)協(xié)議實現(xiàn)你自己的管理平臺。集群模式下的系統(tǒng)結(jié)構(gòu):
zookeeper數(shù)據(jù)結(jié)構(gòu)協(xié)議:
Porter的集群機制主要有以下功能:
實現(xiàn)節(jié)點任務(wù)的負載,當(dāng)前任務(wù)節(jié)點失效后自動漂移到其他任務(wù)節(jié)點
實現(xiàn)任務(wù)節(jié)點與管理節(jié)點的通信
實現(xiàn)任務(wù)處理進度的存儲與拉取
實現(xiàn)統(tǒng)計指標數(shù)據(jù)的上傳(最新的開發(fā)版本支持自定義統(tǒng)計指標上傳客戶端,原生支持kafka)
用于節(jié)點、任務(wù)搶占的分布式鎖實現(xiàn)
基于文件系統(tǒng)的單機模式插件
最新開發(fā)版支持Porter任務(wù)節(jié)點以單機模式運行,不依賴管理后臺和zookeeper,通過配置文件配置任務(wù)。單機模式是一種特殊的集群模式,僅支持部分集群功能,但簡化了任務(wù)部署的復(fù)雜性,靈活多變。
實現(xiàn)任務(wù)處理進度的存儲與拉取
實現(xiàn)統(tǒng)計指標數(shù)據(jù)的上傳
Porter任務(wù)節(jié)點運行模式的配置方式
#zookeeper集群配置
porter.cluster.strategy=ZOOKEEPER
porter.cluster.client.url=127.0.0.1:2181
porter.cluster.client.sessionTimeout=100000
#單機模式配置
porter.cluster.strategy=STANDALONE
porter.cluster.client.home=/path/.porter
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。