分布式SnowFlakeID（雪花ID）原理和改進優(yōu)化

發(fā)布時間：2020-08-09 16:52:24 來源：網(wǎng)絡(luò) 閱讀：186 作者：Java_老男孩欄目：編程語言

最近在研究分布式框架的組件和整體設(shè)計思路。所有的問題，一旦涉及分布式難度就呈幾何倍數(shù)的提升。包括最常見的ID生成也是，單機情況下，使用數(shù)據(jù)庫自增ID、UUID都是簡單易行的選擇

但在分布式環(huán)境下，就需要考慮同業(yè)務(wù)部署多套以后，ID重復(fù)的問題。使用數(shù)據(jù)庫則數(shù)據(jù)庫容易成為瓶頸，使用UUID又沒有順序，數(shù)據(jù)庫集成又會遇到遞增步長等問題。最后，數(shù)據(jù)庫（也可使用redis）號段生成器和snowFlake就成為了目前分布式ID生成器的主流

我所知大部分互聯(lián)網(wǎng)公司的分布式ID生成器，其實都是一個網(wǎng)絡(luò)服務(wù)或集群，單獨部署。其他應(yīng)用程序通過網(wǎng)絡(luò)去獲取分布式的全局唯一ID。使用網(wǎng)絡(luò)服務(wù)的方式，好處顯而易見，就是方便集中管理，只要生成器設(shè)計的沒問題，基本ID就能保證整體趨勢是遞增的。壞處就是獲取效率被明顯降低了

另外針對我司來說，由于項目的性質(zhì)，采用分布式ID生成器，對開發(fā)和上線部署及其后期的運維都會帶來一定的麻煩。畢竟上線后，項目的管理權(quán)就不在我們手上了，所以為了保證分布式ID生成器的穩(wěn)定性，盡量不采取分布式ID生成中心的策略。于是，留給我的選擇就只剩下了SnowFlakeID（雪花ID）了。

什么是SnowFlakeID

SnowFlake是twitter公司內(nèi)部分布式項目采用的ID生成算法，開源后廣受國內(nèi)大廠的好評。由這種算法生成的ID，我們就叫做SnowFlakeID

SnowFlakeID的最大的特性就是天然去中心化，通過時間戳、工作機器編號兩個變量進行配置后，通過SnowFlake算法會生成唯一的遞增ID。在任何機器上，只要保證工作機器編號不同，就可以確保生成的ID唯一，且整體趨勢是遞增的

Snowflake的結(jié)構(gòu)如下(每部分用-分開):

0 - 0000000000 0000000000 0000000000 0000000000 0 - 0000000000 - 000000000000

第一段1位為未使用，永遠固定為0

第二段41位為毫秒級時間(41位的長度可以使用69年)

第三段10位為workerId(10位的長度最多支持部署1024個節(jié)點）

第三段12位為毫秒內(nèi)的計數(shù)（12位的計數(shù)順序號支持每個節(jié)點每毫秒產(chǎn)生4096個ID序號）

如果按照1024的滿節(jié)點（1個節(jié)點就是1個部署的服務(wù)）計算，每毫秒可生成的ID序號有1024*4096=4194304個，足以滿足現(xiàn)在絕大多數(shù)的業(yè)務(wù)情況

算法的核心如下

 ((當(dāng)前時間 - 服務(wù)時間) << timestampLeftShift) 
        | (機器ID << workerIdShift) 
        | sequence;

服務(wù)時間指的是服務(wù)的開發(fā)時間，即第一個正式ID產(chǎn)生的時間。由于SnowFlakeID最長可用69年（因為只有41個bit，41個bit的最大值換算成年就是69年）。所以服務(wù)時間越貼近上線時間，則該算法可用時間越長。
其中sequence為遞增序列，當(dāng)前時間戳和上一ID生成時間戳一致時，sequence就遞增1，直到4096為止。

SnowFlake有什么問題

SnowFlake很好，分布式、去中心化、無第三方依賴。但它并不是完美的，由于SnowFlake強依賴時間戳，所以時間的變動會造成SnowFlake的算法產(chǎn)生錯誤。

時鐘回?fù)?/strong>:最常見的問題就是時鐘回?fù)軐?dǎo)致的ID重復(fù)問題，在SnowFlake算法中并沒有什么有效的解法，僅是拋出異常。時鐘回?fù)苌婕皟煞N情況①實例停機→時鐘回?fù)堋鷮嵗貑ⅰ嬎鉏D ②實例運行中→時鐘回?fù)堋嬎鉏D

手動配置:另一個就是workerId（機器ID）是需要部署時手動配置，而workerId又不能重復(fù)。幾臺實例還好，一旦實例達到一定量級，管理workerId將是一個復(fù)雜的操作。

如何優(yōu)化

時鐘回?fù)芨倪M避免

ID生成器一旦不可用，可能造成所有數(shù)據(jù)庫相關(guān)新增業(yè)務(wù)都不可用，影響太大。所以時鐘回?fù)艿膯栴}必須解決。

造成時鐘回?fù)艿脑蚨喾N多樣，可能是閏秒回?fù)?，可能是NTP同步，還可能是服務(wù)器時間手動調(diào)整?？傊褪菚r間回到了過去。針對回退時間的多少可以進行不同的策略改進。一般有以下幾種方案：

少量服務(wù)器部署ID生成器實例，關(guān)閉NTP服務(wù)器，嚴(yán)格管理服務(wù)器。這種方案不需要從代碼層面解決，完全人治。

針對回退時間斷的情況，如閏秒回?fù)軆H回?fù)芰?s，可以在代碼層面通過判斷暫停一定時間內(nèi)的ID生成器使用。雖然少了幾秒鐘可用時間，但時鐘正常后，業(yè)務(wù)即可恢復(fù)正常。

if (refusedSeconds <= 5) { try { //時間偏差大小小于5ms，則等待兩倍時間 wait(refusedSeconds << 1);//wait } catch (InterruptedException e) { e.printStackTrace(); } currentSecond = getCurrentSecond(); }else {//時鐘回?fù)茌^大 //用其他策略修復(fù)時鐘問題 }

實例啟動后，改用內(nèi)存生成時間。該方案為baidu開源的UidGenerator使用的方案，由于實例啟動后，時間不再從服務(wù)器獲取，所以不管服務(wù)器時鐘如何回?fù)?，都影響不了SnowFlake的執(zhí)行。如下代碼中l(wèi)astSecond變量是一個AtomicLong類型，用以代替系統(tǒng)時間

List<Long> uidList = uidProvider.provide(lastSecond.incrementAndGet());

以上2和3都是解決時鐘實例運行中→時鐘回?fù)堋嬎鉏D的情況。而實例停機→時鐘回?fù)堋鷮嵗貑ⅰ嬎鉏D的情況，可以通過實例啟動的時候，采用未使用過的workerId來完成。只要workerId和此前生成ID的workerId不一致，即便時間戳有誤，所生成的ID也不會重復(fù)。UidGenerator采取的就是這種方案，但這種方案又必須依賴一個存儲中心，不管是redis、mysql、zookeeper都可以，但必須存儲著此前使用過的workerId，不能重復(fù)。尤其是在分布式部署Id生成器的情況下，更要注意用一個存儲中心解決此問題。

UidGenerator代碼可上Githubhttps://github.com/zer0Black/uid-generator查看

手動配置如何變?yōu)樽詣?/h5>
其實該處的方案和時鐘回?fù)艿牡谒膫€方案是一致的，每次重啟實例的時候，自動的查找workerId使用，不依賴手動配置。且自查找的workerId不會重復(fù)。方便管理。

向AI問一下細(xì)節(jié)

推薦閱讀：

什么是分布式SnowFlakeID？如何優(yōu)化SnowFlakeID？

分布式ID生成

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

java 分布式 snowflakeid

上一篇新聞：
JDK9新特性詳解

下一篇新聞：
aText for Mac(打字加速器)v2.36.3

猜你喜歡

java反編譯工具對新手友好嗎

java反編譯工具有哪些推薦

java反編譯工具更新頻繁嗎

java反編譯工具適合哪些人使用

mysql索引為何這么重要

mysql索引能提高速度嗎

mysql索引創(chuàng)建有何技巧

mysql索引使用不當(dāng)?shù)暮蠊?

mysql索引如何優(yōu)化查詢性能

mysql索引有哪些類型

最新資訊

PHP日志記錄如何避免Log4j類似漏洞

PHP日志管理策略調(diào)整防范Log4j風(fēng)險

Log4j事件對PHP日志安全的影響分析

PHP日志系統(tǒng)如何預(yù)防遠程代碼執(zhí)行

PHP日志處理Log4j之外的安心之選

Log4j漏洞后PHP日志審計要點

PHP日志管理新方向：后Log4j時代

PHP項目如何確保日志安全非Log4j

PHP日志記錄策略調(diào)整應(yīng)對Log4j

Log4j漏洞啟示：PHP日志安全加固

相關(guān)推薦

雪花算法生成id的方法

mysql中不推薦使用uuid和雪花id作為主鍵的原因是什么

Java如何實現(xiàn)雪花算法的原理

mybatis-plus雪花算法自動生成機器id原理的示例分析

雪花算法中如何使用ID生成工具

mybatis-plus怎么使用雪花算法ID生成策略

MyBatis使用雪花ID怎么實現(xiàn)

Java怎么通過手寫分布式雪花SnowFlake生成ID

PHP怎么利用雪花算法生成唯一ID

mybatisplus雪花算法生成Id怎么使用

相關(guān)標(biāo)簽

java- -java javabean javafx與jfoenix教程凱哥java java日志 java面試初學(xué)java javaserver java反射 javascript對象 java14 javascript函數(shù) java爬蟲 java9 javascript/jquery javacv weixin-java-miniapp java7 java me

分布式SnowFlakeID（雪花ID）原理和改進優(yōu)化

什么是SnowFlakeID

SnowFlake有什么問題

如何優(yōu)化

時鐘回?fù)芨倪M避免

手動配置如何變?yōu)樽詣?/h5> 其實該處的方案和時鐘回?fù)艿牡谒膫€方案是一致的，每次重啟實例的時候，自動的查找workerId使用，不依賴手動配置。且自查找的workerId不會重復(fù)。方便管理。

猜你喜歡

最新資訊

相關(guān)推薦

相關(guān)標(biāo)簽

手動配置如何變?yōu)樽詣?/h5>
其實該處的方案和時鐘回?fù)艿牡谒膫€方案是一致的，每次重啟實例的時候，自動的查找workerId使用，不依賴手動配置。且自查找的workerId不會重復(fù)。方便管理。