溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

萬億級數(shù)據(jù)應(yīng)該遷移的方法

發(fā)布時間:2020-10-24 14:26:27 來源:億速云 閱讀:142 作者:小新 欄目:編程語言

小編給大家分享一下萬億級數(shù)據(jù)應(yīng)該遷移的方法,希望大家閱讀完這篇文章后大所收獲,下面讓我們一起去探討吧!

背景

在星爺?shù)摹洞笤捨饔巍分杏幸痪浞浅3雒呐_詞:“曾經(jīng)有一份真摯的感情擺在我的面前我沒有珍惜,等我失去的時候才追悔莫及,人間最痛苦的事莫過于此,如果上天能給我一次再來一次的機(jī)會,我會對哪個女孩說三個字:我愛你,如果非要在這份愛上加一個期限,我希望是一萬年!”在我們開發(fā)人員的眼中,這個感情就和我們數(shù)據(jù)庫中的數(shù)據(jù)一樣,我們多希望他一萬年都不改變,但是往往事與愿違,隨著公司的不斷發(fā)展,業(yè)務(wù)的不斷變更,我們對數(shù)據(jù)的要求也在不斷的變化,大概有下面的幾種情況:

  • 分庫分表:業(yè)務(wù)發(fā)展越來越快,導(dǎo)致單機(jī)數(shù)據(jù)庫承受的壓力越來越大,數(shù)據(jù)量也越來越多,這個時候通常會使用分庫的方法去解決這個問題,將數(shù)據(jù)庫的流量均分到不同的機(jī)器上。從單機(jī)數(shù)據(jù)庫到分庫這個過程,我們就需要完整的遷移我們的數(shù)據(jù),我們才能成功的分庫的方式上使用我們的數(shù)據(jù)。
  • 更換存儲介質(zhì):上面介紹的分庫,一般來說我們遷移完之后,存儲介質(zhì)依然是同樣的,比如說之前使用的是單機(jī)Mysql,分庫之后就變成了多臺機(jī)器的Mysql,我們的數(shù)據(jù)庫表的字段都沒有發(fā)生變化,遷移來說相對比較簡單。有時候我們分庫分表并不能解決所有的問題,如果我們需要很多復(fù)雜的查詢,這個時候使用Mysql可能就不是一個靠譜的方案,那么我們就需要替換查詢的存儲介質(zhì),比如使用elasticsearch,這種的遷移就會稍微要復(fù)雜一些,涉及到不同存儲介質(zhì)的數(shù)據(jù)轉(zhuǎn)換。
  • 切換新系統(tǒng):一般公司在高速發(fā)展中,一定會出現(xiàn)很多為了速度快然后重復(fù)建設(shè)的項目,當(dāng)公司再一定時間段的時候,往往這部分項目會被合并,變成一個平臺或者中臺,比如我們一些會員系統(tǒng),電商系統(tǒng)等等。這個時候往往就會面臨一個問題,將老的系統(tǒng)中的數(shù)據(jù)需要遷移到新的系統(tǒng)中,這個時候就更加復(fù)雜了,有可能不僅是存儲介質(zhì)有變動,有可能項目語言也不同,從更上層的角度來看,部門有可能也不同,所以這種數(shù)據(jù)遷移的難度是比較高,風(fēng)險也更加的大。

在實際業(yè)務(wù)開發(fā)中,我們會根據(jù)不同的情況來做出不同的遷移方案,接下來我們來討論一下到底應(yīng)該怎么遷移數(shù)據(jù)。

數(shù)據(jù)遷移

數(shù)據(jù)遷移其實不是一蹴而就的,每一次數(shù)據(jù)遷移都需要一段漫長的時間,有可能是一周,有可能是幾個月,通常來說我們遷移數(shù)據(jù)的過程基本都和下圖差不多:萬億級數(shù)據(jù)應(yīng)該遷移的方法‘ 首先我們需要將我們數(shù)據(jù)庫已經(jīng)存在的數(shù)據(jù)進(jìn)行批量的遷移,然后需要處理新增的這部分?jǐn)?shù)據(jù),需要實時的把這部分?jǐn)?shù)據(jù)在寫完原本的數(shù)據(jù)庫之后然后寫到我們的新的存儲,在這一過程中我們需要不斷的進(jìn)行數(shù)據(jù)校驗。當(dāng)我們校驗基本問題不大的時候,然后進(jìn)行切流操作,直到完全切流之后,我們就可以不用再進(jìn)行數(shù)據(jù)校驗和增量數(shù)據(jù)遷移。

存量數(shù)據(jù)遷移

首先我們來說一下存量數(shù)據(jù)遷移應(yīng)該怎么做,存量數(shù)據(jù)遷移在開源社區(qū)中搜索了一圈發(fā)現(xiàn)沒有太好用的工具,目前來說阿里云的DTS提供了存量數(shù)據(jù)遷移,DTS支持同構(gòu)和異構(gòu)不同數(shù)據(jù)源之間的遷移,基本支持業(yè)界常見的數(shù)據(jù)庫比如Mysql,Orcale,SQL Server等等。DTS比較適合我們之前說的前兩個場景,一個是分庫的場景,如果使用的是阿里云的DRDS那么就可以直接將數(shù)據(jù)通過DTS遷移到DRDS,另外一個是數(shù)據(jù)異構(gòu)的場景,無論是Redis還是ES,DTS都支持直接進(jìn)行遷移。

那么DTS的存量遷移怎么做的呢?其實比較簡單大概就是下面幾個步驟:

  1. 當(dāng)存量遷移任務(wù)啟動的時候,我們獲取當(dāng)前需要遷移的最大的id和最小id
  2. 設(shè)置一個分段,比如1萬,從最小id開始每次查詢1萬的數(shù)據(jù)給DTS服務(wù)器,交給DTS處理。sql如下:
select * from table_name where id > curId and id < curId + 10000;復(fù)制代碼

3.當(dāng)id大于等于maxId之后,存量數(shù)據(jù)遷移任務(wù)結(jié)束

當(dāng)然我們在實際的遷移過程中可能不會去使用阿里云,或者說在我們的第三個場景下,我們的數(shù)據(jù)庫字段之間需要做很多轉(zhuǎn)換,DTS不支持,那么我們就可以模仿DTS的做法,通過分段批量讀取數(shù)據(jù)的方式來遷移數(shù)據(jù),這里需要注意的是我們批量遷移數(shù)據(jù)的時候需要控制分段的大小,以及頻率,防止影響我們線上的正常運(yùn)行。

增量數(shù)據(jù)遷移

存量數(shù)據(jù)的遷移方案比較有限,但是增量的數(shù)據(jù)遷移方法就是百花齊放了,一般來說我們有下面的幾種方法:

  • DTS: 阿里云的DTS算是一條龍服務(wù)了,在提供存量數(shù)據(jù)遷移的同時也提供了增量數(shù)據(jù)遷移,只不過需要按量收費(fèi)。
  • 服務(wù)雙寫:比較適合于系統(tǒng)沒有切換的遷移,也就是只換了存儲但是系統(tǒng)還是同一個,比如說分庫分表,redis數(shù)據(jù)同步等,這個的做法比較簡單直接在代碼里面同步的去寫入需要遷移的數(shù)據(jù),但是由于不是同一個數(shù)據(jù)庫就不能保證事務(wù),有可能導(dǎo)致遷移數(shù)據(jù)的時候會出現(xiàn)數(shù)據(jù)丟失,這個過程通過后續(xù)的數(shù)據(jù)校驗會進(jìn)行解決。
  • MQ異步寫入:這個可以適用于所有的場景,當(dāng)有數(shù)據(jù)修改的時候發(fā)送一個MQ消息,消費(fèi)者收到這個消息之后再進(jìn)行數(shù)據(jù)更新。這個和上面的雙寫有點(diǎn)類似,但是他把數(shù)據(jù)庫的操作變成了MQ異步了出問題的概率就會小很多
  • 監(jiān)聽binlog: 我們可以使用之前說過的canal或者其他的一些開源的如databus去進(jìn)行binlog監(jiān)聽,監(jiān)聽binlog的方式 就和上面的消息MQ方式一樣,只是發(fā)送消息的這一步被我們省略了。這個方式的一個開發(fā)量來說基本是最小的。

這么多種方式我們應(yīng)該使用哪種呢?我個人來說是比較推薦監(jiān)聽binlog的做法的,監(jiān)聽binlog減少開發(fā)成本,我們只需要實現(xiàn)consumer邏輯即可,數(shù)據(jù)能保證一致性,因為是監(jiān)聽的binlog這里不需要擔(dān)心之前雙寫的時候不是一個事務(wù)的問題。

數(shù)據(jù)校驗

前面所說的所有方案,雖然有很多是成熟的云服務(wù)(dts)或者中間件(canal),但是他們都有可能出現(xiàn)一些數(shù)據(jù)丟失,出現(xiàn)數(shù)據(jù)丟失的情況整體來說還是比較少,但是非常難排查,有可能是dts或者canal不小心抖了一下,又或者是接收數(shù)據(jù)的時候不小心導(dǎo)致的丟失。既然我們沒有辦法避免我們的數(shù)據(jù)在遷移的過程中丟失,那么我們應(yīng)該通過其他手段來進(jìn)行校正。

通常來說我們遷移數(shù)據(jù)的時候都會有數(shù)據(jù)校驗這一個步驟,但是在不同團(tuán)隊可能會選取不同的數(shù)據(jù)校驗方案:

  • 之前在美團(tuán)的時候,我們會做一個雙讀,也就是我們所有的讀取都會從新的里面讀取一份,但是返回的還是老的,這個時候我們需要做這部分?jǐn)?shù)據(jù)的校驗,如果有問題可以發(fā)出報警人工修復(fù)或者自動修復(fù)。通過這種方式,我們常用的數(shù)據(jù)就能很快的進(jìn)行一個修復(fù),當(dāng)然也會不定時的去跑一個全量的數(shù)據(jù)check,只是這種check出來修復(fù)數(shù)據(jù)的時間就比較滯后。
  • 現(xiàn)在在猿輔導(dǎo)之后,我們沒有采用之前的那種方式,因為雙讀check雖然能很快發(fā)現(xiàn)數(shù)據(jù)的不對,但是我們并沒有對這部分?jǐn)?shù)據(jù)有那么高的一個實時性校驗并且雙讀的一個代碼開發(fā)量還是稍微比較大的,但是又不能依靠不定時全量check去保證,這樣就會導(dǎo)致我們的數(shù)據(jù)校驗時間會非常的延長。我們采取了一個折中的方法,我們借鑒了對賬里面的T+1的一個思路,我們每天凌晨獲取老數(shù)據(jù)庫中昨天更新的數(shù)據(jù),然后和我們新數(shù)據(jù)庫中的數(shù)據(jù)做一一比對,如果有數(shù)據(jù)不一樣或者數(shù)據(jù)缺失,我們都可以立馬進(jìn)行一個修復(fù)。

當(dāng)然在實際開發(fā)過程中我們也需要注意下面幾點(diǎn):

  • 數(shù)據(jù)校驗任務(wù)的一個正確性如何保證,校驗任務(wù)本來就是去校正其他數(shù)據(jù)的,但是如果他自身出現(xiàn)了問題,就失去了校驗的意義,這里目前來說只能靠review代碼這種方式去保證校驗任務(wù)的正確性。
  • 校驗任務(wù)的時候需要注意日志的打印,有時候出現(xiàn)問題可能是直接所有數(shù)據(jù)出現(xiàn)問題,那么校驗任務(wù)就有可能會打出大量的錯誤日志,然后進(jìn)行報警,有可能會將系統(tǒng)打掛,或者說影響其他人的服務(wù)。這里如果要簡單一點(diǎn)搞,可以將一些非人工處理的報警搞成warn,復(fù)雜一點(diǎn)搞得話,可以封裝一個工具,某個error打印再某個時間段超過一定量然后就不用再打印了。
  • 校驗任務(wù)注意不要影響線上運(yùn)行的服務(wù),通常校驗任務(wù)會寫很多批查詢的語句,會出現(xiàn)批量掃表的情況,如果代碼沒有寫好很容易導(dǎo)致數(shù)據(jù)庫掛掉。

切流

當(dāng)我們數(shù)據(jù)校驗基本沒有報錯了之后,說明我們的遷移程序是比較穩(wěn)定的了,那么我們就可以直接使用我們新的數(shù)據(jù)了嗎?當(dāng)然是不可以的,如果我們一把切換了,順利的話當(dāng)然是很好的,如果出現(xiàn)問題了,那么就會影響所有的用戶。

所以我們接下來就需要進(jìn)行灰度,也就是切流。 對于不同的業(yè)務(wù)切流的的維度會不一樣,對于用戶維度的切流,我們通常會以userId的取模的方式去進(jìn)行切流,對于租戶或者商家維度的業(yè)務(wù),就需要按照租戶id取模的方式去切流。這個切流需要制定好一個切流計劃,在什么時間段,放出多少的流量,并且切流的時候一定要選擇流量比較少的時候進(jìn)行切流,每一次切流都需要對日志做詳細(xì)的觀察,出現(xiàn)問題盡早修復(fù),流量的一個放出過程是一個由慢到快的過程,比如最開始是以1%的量去不斷疊加的,到后面的時候我們直接以10%,20%的量去快速放量。因為如果出現(xiàn)問題的話往往在小流量的時候就會發(fā)現(xiàn),如果小流量沒有問題那么后續(xù)就可以快速放量。

注意主鍵ID

在遷移數(shù)據(jù)的過程中特別要注意的是主鍵ID,在上面雙寫的方案中也提到過主鍵ID需要雙寫的時候手動的去指定,防止ID生成順序錯誤。

如果我們是因為分庫分表而進(jìn)行遷移,就需要考慮我們以后的主鍵Id就不能是自增id,需要使用分布式id,這里比較推薦的是美團(tuán)開源的leaf,他支持兩種模式一種是雪花算法趨勢遞增,但是所有的id都是Long型,適合于一些支持Long為id的應(yīng)用。還有一種是號段模式,這種會根據(jù)你設(shè)置的一個基礎(chǔ)id,從這個上面不斷的增加。并且基本都走的是內(nèi)存生成,性能也是非常的快。

當(dāng)然我們還有種情況是我們需要遷移系統(tǒng),之前系統(tǒng)的主鍵id在新系統(tǒng)中已經(jīng)有了,那么我們的id就需要做一些映射。如果我們在遷移系統(tǒng)的時候已經(jīng)知道未來大概有哪些系統(tǒng)會遷移進(jìn)來,我們就可以采用預(yù)留的方式,比如A系統(tǒng)現(xiàn)在的數(shù)據(jù)是1到1億,B系統(tǒng)的數(shù)據(jù)也是1到1億,我們現(xiàn)在需要將A,B兩個系統(tǒng)合并成新系統(tǒng),那么我們可以稍微預(yù)估一些Buffer,比如給A系統(tǒng)留1到1.5億,這樣A就不需要進(jìn)行映射,B系統(tǒng)是1.5億到3億,那么我們轉(zhuǎn)換成老系統(tǒng)Id的時候就需要減去1.5億,最后我們新系統(tǒng)的新的Id就從3億開始遞增。 但是如果系統(tǒng)中沒有做規(guī)劃的預(yù)留段怎么辦呢?可以通過下面兩種方式:

  • 需要新增一個表,將老系統(tǒng)的id和新系統(tǒng)的id做一個映射記錄,這個工作量還是比較大的,因為我們一般遷移都會涉及幾十上百張表,記錄的成本還是非常的高。
  • 如果id是Long型的話,我們可以好好利用long是64位這個因素,我們可以制定一個規(guī)則,我們新系統(tǒng)的id都是從一個比較大的數(shù)開始,比如從大于Int的數(shù)開始,將小Int的那部分?jǐn)?shù)都可以留給我們的老系統(tǒng)做Id遷移,比如我們上面的1.5億的數(shù)據(jù)量,其實只用了28位,我們的Int是32位,那么還有4位可以使用,這個4位可以代表16個系統(tǒng)做遷移,當(dāng)然如果規(guī)劃中有更多的系統(tǒng)做遷移,可以將新系統(tǒng)的id起始點(diǎn)設(shè)置得更大一點(diǎn)。如下圖所示:萬億級數(shù)據(jù)應(yīng)該遷移的方法

看完了這篇文章,相信你對萬億級數(shù)據(jù)應(yīng)該遷移的方法有了一定的了解,想了解更多相關(guān)知識,歡迎關(guān)注億速云行業(yè)資訊頻道,感謝各位的閱讀!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI