<ul id="iubuq"></ul>

<address id="iubuq"><tfoot id="iubuq"></tfoot></address>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗證碼

其他方式登錄

點擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時！

請點擊重新獲取二維碼

怎么淺談分布式消息技術(shù)Kafka

發(fā)布時間：2021-12-15 16:12:56 來源：億速云閱讀：76 作者：柒染欄目：互聯(lián)網(wǎng)科技

這篇文章將為大家詳細講解有關(guān)怎么淺談分布式消息技術(shù)Kafka，文章內(nèi)容質(zhì)量較高，因此小編分享給大家做個參考，希望大家閱讀完這篇文章后對相關(guān)知識有一定的了解。

Kafka的基本介紹

Kafka是最初由Linkedin公司開發(fā)，是一個分布式、分區(qū)的、多副本的、多訂閱者，基于zookeeper協(xié)調(diào)的分布式日志系統(tǒng)（也可以當做MQ系統(tǒng)），常見可以用于web/nginx日志、訪問日志，消息服務(wù)等等，Linkedin于2010年貢獻給了Apache基金會并成為頂級開源項目。

主要應(yīng)用場景是：日志收集系統(tǒng)和消息系統(tǒng)。

Kafka主要設(shè)計目標如下：

以時間復(fù)雜度為O(1)的方式提供消息持久化能力，即使對TB級以上數(shù)據(jù)也能保證常數(shù)時間的訪問性能。
高吞吐率。即使在非常廉價的商用機器上也能做到單機支持每秒100K條消息的傳輸。
支持Kafka Server間的消息分區(qū)，及分布式消費，同時保證每個partition內(nèi)的消息順序傳輸。
同時支持離線數(shù)據(jù)處理和實時數(shù)據(jù)處理。

Kafka的設(shè)計原理分析

怎么淺談分布式消息技術(shù)Kafka

一個典型的kafka集群中包含若干producer，若干broker，若干consumer，以及一個Zookeeper集群。Kafka通過Zookeeper管理集群配置，選舉leader，以及在consumer group發(fā)生變化時進行rebalance。producer使用push模式將消息發(fā)布到broker，consumer使用pull模式從broker訂閱并消費消息。　

Kafka專用術(shù)語：

Broker：消息中間件處理結(jié)點，一個Kafka節(jié)點就是一個broker，多個broker可以組成一個Kafka集群。
Topic：一類消息，Kafka集群能夠同時負責(zé)多個topic的分發(fā)。
Partition：topic物理上的分組，一個topic可以分為多個partition，每個partition是一個有序的隊列。
Segment：partition物理上由多個segment組成。
offset：每個partition都由一系列有序的、不可變的消息組成，這些消息被連續(xù)的追加到partition中。partition中的每個消息都有一個連續(xù)的序列號叫做offset，用于partition唯一標識一條消息。
Producer：負責(zé)發(fā)布消息到Kafka broker。
Consumer：消息消費者，向Kafka broker讀取消息的客戶端。
Consumer Group：每個Consumer屬于一個特定的Consumer Group。

Kafka數(shù)據(jù)傳輸?shù)氖聞?wù)特點

at most once：最多一次，這個和JMS中”非持久化”消息類似，發(fā)送一次，無論成敗，將不會重發(fā)。消費者fetch消息，然后保存offset，然后處理消息；當client保存offset之后，但是在消息處理過程中出現(xiàn)了異常，導(dǎo)致部分消息未能繼續(xù)處理。那么此后”未處理”的消息將不能被fetch到，這就是”at most once”。
at least once：消息至少發(fā)送一次，如果消息未能接受成功，可能會重發(fā)，直到接收成功。消費者fetch消息，然后處理消息，然后保存offset。如果消息處理成功之后，但是在保存offset階段zookeeper異常導(dǎo)致保存操作未能執(zhí)行成功，這就導(dǎo)致接下來再次fetch時可能獲得上次已經(jīng)處理過的消息，這就是”at least once”，原因offset沒有及時的提交給zookeeper，zookeeper恢復(fù)正常還是之前offset狀態(tài)。
exactly once：消息只會發(fā)送一次。kafka中并沒有嚴格的去實現(xiàn)（基于2階段提交），我們認為這種策略在kafka中是沒有必要的。

通常情況下”at-least-once”是我們首選。

Kafka消息存儲格式

Topic & Partition

一個topic可以認為一個一類消息，每個topic將被分成多個partition，每個partition在存儲層面是append log文件。

怎么淺談分布式消息技術(shù)Kafka

在Kafka文件存儲中，同一個topic下有多個不同partition，每個partition為一個目錄，partiton命名規(guī)則為topic名稱+有序序號，第一個partiton序號從0開始，序號最大值為partitions數(shù)量減1。

怎么淺談分布式消息技術(shù)Kafka

每個partion（目錄）相當于一個巨型文件被平均分配到多個大小相等segment（段）數(shù)據(jù)文件中。但每個段segment file消息數(shù)量不一定相等，這種特性方便old segment file快速被刪除。
每個partiton只需要支持順序讀寫就行了，segment文件生命周期由服務(wù)端配置參數(shù)決定。

這樣做的好處就是能快速刪除無用文件，有效提高磁盤利用率。

segment file組成：由2大部分組成，分別為index file和data file，此2個文件一一對應(yīng)，成對出現(xiàn)，后綴”.index”和“.log”分別表示為segment索引文件、數(shù)據(jù)文件.
segment文件命名規(guī)則：partion全局的第一個segment從0開始，后續(xù)每個segment文件名為上一個segment文件最后一條消息的offset值。數(shù)值最大為64位long大小，19位數(shù)字字符長度，沒有數(shù)字用0填充。

怎么淺談分布式消息技術(shù)Kafka

segment中index與data file對應(yīng)關(guān)系物理結(jié)構(gòu)如下：

怎么淺談分布式消息技術(shù)Kafka

上圖中索引文件存儲大量元數(shù)據(jù)，數(shù)據(jù)文件存儲大量消息，索引文件中元數(shù)據(jù)指向?qū)?yīng)數(shù)據(jù)文件中message的物理偏移地址。

其中以索引文件中元數(shù)據(jù)3,497為例，依次在數(shù)據(jù)文件中表示第3個message（在全局partiton表示第368772個message），以及該消息的物理偏移地址為497。

了解到segment data file由許多message組成，下面詳細說明message物理結(jié)構(gòu)如下：

怎么淺談分布式消息技術(shù)Kafka

參數(shù)說明：

關(guān)鍵字	解釋說明
8 byte offset	在parition(分區(qū))內(nèi)的每條消息都有一個有序的id號，這個id號被稱為偏移(offset),它可以唯一確定每條消息在parition(分區(qū))內(nèi)的位置。即offset表示partiion的第多少message
4 byte message size	message大小
4 byte CRC32	用crc32校驗message
1 byte “magic”	表示本次發(fā)布Kafka服務(wù)程序協(xié)議版本號
1 byte “attributes”	表示為獨立版本、或標識壓縮類型、或編碼類型。
4 byte key length	表示key的長度,當key為-1時，K byte key字段不填
K byte key	可選
value bytes payload	表示實際消息數(shù)據(jù)。

副本（replication）策略

Kafka的高可靠性的保障來源于其健壯的副本（replication）策略。

1) 數(shù)據(jù)同步

kafka在0.8版本前沒有提供Partition的Replication機制，一旦Broker宕機，其上的所有Partition就都無法提供服務(wù)，而Partition又沒有備份數(shù)據(jù)，數(shù)據(jù)的可用性就大大降低了。所以0.8后提供了Replication機制來保證Broker的failover。

引入Replication之后，同一個Partition可能會有多個Replica，而這時需要在這些Replication之間選出一個Leader，Producer和Consumer只與這個Leader交互，其它Replica作為Follower從Leader中復(fù)制數(shù)據(jù)。

怎么淺談分布式消息技術(shù)Kafka

2) 副本放置策略

為了更好的做負載均衡，Kafka盡量將所有的Partition均勻分配到整個集群上。

Kafka分配Replica的算法如下：

將所有存活的N個Brokers和待分配的Partition排序
將第i個Partition分配到第(i mod n)個Broker上，這個Partition的第一個Replica存在于這個分配的Broker上，并且會作為partition的優(yōu)先副本
將第i個Partition的第j個Replica分配到第((i + j) mod n)個Broker上

假設(shè)集群一共有4個brokers，一個topic有4個partition，每個Partition有3個副本。下圖是每個Broker上的副本分配情況。

怎么淺談分布式消息技術(shù)Kafka

3) 同步策略

Producer在發(fā)布消息到某個Partition時，先通過ZooKeeper找到該Partition的Leader，然后無論該Topic的Replication Factor為多少，Producer只將該消息發(fā)送到該Partition的Leader。Leader會將該消息寫入其本地Log。每個Follower都從Leader pull數(shù)據(jù)。這種方式上，F(xiàn)ollower存儲的數(shù)據(jù)順序與Leader保持一致。Follower在收到該消息并寫入其Log后，向Leader發(fā)送ACK。一旦Leader收到了ISR中的所有Replica的ACK，該消息就被認為已經(jīng)commit了，Leader將增加HW并且向Producer發(fā)送ACK。

為了提高性能，每個Follower在接收到數(shù)據(jù)后就立馬向Leader發(fā)送ACK，而非等到數(shù)據(jù)寫入Log中。因此，對于已經(jīng)commit的消息，Kafka只能保證它被存于多個Replica的內(nèi)存中，而不能保證它們被持久化到磁盤中，也就不能完全保證異常發(fā)生后該條消息一定能被Consumer消費。

Consumer讀消息也是從Leader讀取，只有被commit過的消息才會暴露給Consumer。

Kafka Replication的數(shù)據(jù)流如下圖所示：

怎么淺談分布式消息技術(shù)Kafka

對于Kafka而言，定義一個Broker是否“活著”包含兩個條件：

一是它必須維護與ZooKeeper的session（這個通過ZooKeeper的Heartbeat機制來實現(xiàn)）。
二是Follower必須能夠及時將Leader的消息復(fù)制過來，不能“落后太多”。

Leader會跟蹤與其保持同步的Replica列表，該列表稱為ISR（即in-sync Replica）。如果一個Follower宕機，或者落后太多，Leader將把它從ISR中移除。這里所描述的“落后太多”指Follower復(fù)制的消息落后于Leader后的條數(shù)超過預(yù)定值或者Follower超過一定時間未向Leader發(fā)送fetch請求。

Kafka只解決fail/recover，一條消息只有被ISR里的所有Follower都從Leader復(fù)制過去才會被認為已提交。這樣就避免了部分數(shù)據(jù)被寫進了Leader，還沒來得及被任何Follower復(fù)制就宕機了，而造成數(shù)據(jù)丟失（Consumer無法消費這些數(shù)據(jù)）。而對于Producer而言，它可以選擇是否等待消息commit。這種機制確保了只要ISR有一個或以上的Follower，一條被commit的消息就不會丟失。

4) leader選舉

Leader選舉本質(zhì)上是一個分布式鎖，有兩種方式實現(xiàn)基于ZooKeeper的分布式鎖：

節(jié)點名稱唯一性：多個客戶端創(chuàng)建一個節(jié)點，只有成功創(chuàng)建節(jié)點的客戶端才能獲得鎖
臨時順序節(jié)點：所有客戶端在某個目錄下創(chuàng)建自己的臨時順序節(jié)點，只有序號最小的才獲得鎖

Majority Vote的選舉策略和ZooKeeper中的Zab選舉是類似的，實際上ZooKeeper內(nèi)部本身就實現(xiàn)了少數(shù)服從多數(shù)的選舉策略。kafka中對于Partition的leader副本的選舉采用了第一種方法：為Partition分配副本，指定一個ZNode臨時節(jié)點，第一個成功創(chuàng)建節(jié)點的副本就是Leader節(jié)點，其他副本會在這個ZNode節(jié)點上注冊Watcher監(jiān)聽器，一旦Leader宕機，對應(yīng)的臨時節(jié)點就會被自動刪除，這時注冊在該節(jié)點上的所有Follower都會收到監(jiān)聽器事件，它們都會嘗試創(chuàng)建該節(jié)點，只有創(chuàng)建成功的那個follower才會成為Leader（ZooKeeper保證對于一個節(jié)點只有一個客戶端能創(chuàng)建成功），其他follower繼續(xù)重新注冊監(jiān)聽事件。

Kafka消息分組，消息消費原理

同一Topic的一條消息只能被同一個Consumer Group內(nèi)的一個Consumer消費，但多個Consumer Group可同時消費這一消息。

怎么淺談分布式消息技術(shù)Kafka

這是Kafka用來實現(xiàn)一個Topic消息的廣播（發(fā)給所有的Consumer）和單播（發(fā)給某一個Consumer）的手段。一個Topic可以對應(yīng)多個Consumer Group。如果需要實現(xiàn)廣播，只要每個Consumer有一個獨立的Group就可以了。要實現(xiàn)單播只要所有的Consumer在同一個Group里。用Consumer Group還可以將Consumer進行自由的分組而不需要多次發(fā)送消息到不同的Topic。

Push vs. Pull

作為一個消息系統(tǒng)，Kafka遵循了傳統(tǒng)的方式，選擇由Producer向broker push消息并由Consumer從broker pull消息。

push模式很難適應(yīng)消費速率不同的消費者，因為消息發(fā)送速率是由broker決定的。push模式的目標是盡可能以最快速度傳遞消息，但是這樣很容易造成Consumer來不及處理消息，典型的表現(xiàn)就是拒絕服務(wù)以及網(wǎng)絡(luò)擁塞。而pull模式則可以根據(jù)Consumer的消費能力以適當?shù)乃俾氏M消息。

對于Kafka而言，pull模式更合適。pull模式可簡化broker的設(shè)計，Consumer可自主控制消費消息的速率，同時Consumer可以自己控制消費方式——即可批量消費也可逐條消費，同時還能選擇不同的提交方式從而實現(xiàn)不同的傳輸語義。

Kafak順序?qū)懭肱c數(shù)據(jù)讀取

生產(chǎn)者（producer）是負責(zé)向Kafka提交數(shù)據(jù)的，Kafka會把收到的消息都寫入到硬盤中，它絕對不會丟失數(shù)據(jù)。為了優(yōu)化寫入速度Kafak采用了兩個技術(shù)，順序?qū)懭牒蚆MFile。

順序?qū)懭?/strong>

因為硬盤是機械結(jié)構(gòu)，每次讀寫都會尋址，寫入，其中尋址是一個“機械動作”，它是最耗時的。所以硬盤最“討厭”隨機I/O，最喜歡順序I/O。為了提高讀寫硬盤的速度，Kafka就是使用順序I/O。

每條消息都被append到該Partition中，屬于順序?qū)懘疟P，因此效率非常高。

對于傳統(tǒng)的message queue而言，一般會刪除已經(jīng)被消費的消息，而Kafka是不會刪除數(shù)據(jù)的，它會把所有的數(shù)據(jù)都保留下來，每個消費者（Consumer）對每個Topic都有一個offset用來表示讀取到了第幾條數(shù)據(jù)。

即便是順序?qū)懭胗脖P，硬盤的訪問速度還是不可能追上內(nèi)存。所以Kafka的數(shù)據(jù)并不是實時的寫入硬盤，它充分利用了現(xiàn)代操作系統(tǒng)分頁存儲來利用內(nèi)存提高I/O效率。

在Linux Kernal 2.2之后出現(xiàn)了一種叫做“零拷貝(zero-copy)”系統(tǒng)調(diào)用機制，就是跳過“用戶緩沖區(qū)”的拷貝，建立一個磁盤空間和內(nèi)存空間的直接映射，數(shù)據(jù)不再復(fù)制到“用戶態(tài)緩沖區(qū)”系統(tǒng)上下文切換減少2次，可以提升一倍性能。

通過mmap，進程像讀寫硬盤一樣讀寫內(nèi)存（當然是虛擬機內(nèi)存）。使用這種方式可以獲取很大的I/O提升，省去了用戶空間到內(nèi)核空間復(fù)制的開銷（調(diào)用文件的read會把數(shù)據(jù)先放到內(nèi)核空間的內(nèi)存中，然后再復(fù)制到用戶空間的內(nèi)存中。）

消費者（讀取數(shù)據(jù)）

試想一下，一個Web Server傳送一個靜態(tài)文件，如何優(yōu)化？答案是zero copy。傳統(tǒng)模式下我們從硬盤讀取一個文件是這樣的。

先復(fù)制到內(nèi)核空間（read是系統(tǒng)調(diào)用，放到了DMA，所以用內(nèi)核空間），然后復(fù)制到用戶空間（1、2）；從用戶空間重新復(fù)制到內(nèi)核空間（你用的socket是系統(tǒng)調(diào)用，所以它也有自己的內(nèi)核空間），最后發(fā)送給網(wǎng)卡（3、4）。

Zero Copy中直接從內(nèi)核空間（DMA的）到內(nèi)核空間（Socket的），然后發(fā)送網(wǎng)卡。這個技術(shù)非常普遍，Nginx也是用的這種技術(shù)。

實際上，Kafka把所有的消息都存放在一個一個的文件中，當消費者需要數(shù)據(jù)的時候Kafka直接把“文件”發(fā)送給消費者。當不需要把整個文件發(fā)出去的時候，Kafka通過調(diào)用Zero Copy的sendfile這個函數(shù)，這個函數(shù)包括：

out_fd作為輸出（一般及時socket的句柄）
in_fd作為輸入文件句柄
off_t表示in_fd的偏移（從哪里開始讀?。?/p>
size_t表示讀取多少個

關(guān)于怎么淺談分布式消息技術(shù)Kafka就分享到這里了，希望以上內(nèi)容可以對大家有一定的幫助，可以學(xué)到更多知識。如果覺得文章不錯，可以把它分享出去讓更多的人看到。

向AI問一下細節(jié)

推薦閱讀：

淺談技術(shù)價值

簡單搭建 Apache Kafka 分布式消息系統(tǒng)

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進行舉報，并提供相關(guān)證據(jù)，一經(jīng)查實，將立刻刪除涉嫌侵權(quán)內(nèi)容。

kafka

上一篇新聞：
Dubbo應(yīng)用級服務(wù)是怎樣的

下一篇新聞：
如何解析SAP Data Intelligence Modeler里的Kafka Producer和Kafka Consumer

猜你喜歡

云服務(wù)器怎么優(yōu)化

ubuntu如何安裝Windows應(yīng)用

Ubuntu如何重啟防火墻

ubuntu如何查詢是否聯(lián)網(wǎng)

ubuntu上怎么重新裝qt

redis怎么開啟rdb快照

mysql怎么在字符里找字符串

ubuntu如何重啟php

mysql怎么更換字符串

ubuntu怎么重新安裝AMD

最新資訊

PHP日志記錄如何避免Log4j類似漏洞

PHP日志管理策略調(diào)整防范Log4j風(fēng)險

Log4j事件對PHP日志安全的影響分析

PHP日志系統(tǒng)如何預(yù)防遠程代碼執(zhí)行

PHP日志處理Log4j之外的安心之選

Log4j漏洞后PHP日志審計要點

PHP日志管理新方向：后Log4j時代

PHP項目如何確保日志安全非Log4j

PHP日志記錄策略調(diào)整應(yīng)對Log4j

Log4j漏洞啟示：PHP日志安全加固

相關(guān)推薦

淺談加密技術(shù)

淺談android hook技術(shù)

淺談網(wǎng)絡(luò)語音技術(shù)

淺談Android 指紋解鎖技術(shù)

Kafka無法消費?!我的分布式消息服務(wù)Kafka卻穩(wěn)如泰山！

如何使用kafka技術(shù)

怎么解析分布式消息系統(tǒng)Kafka

分布式消息系統(tǒng)kafka該怎么理解

如何解析分布式消息系統(tǒng)Kafka

Linux下如何部署分布式消息系統(tǒng)Kafka

相關(guān)標簽

kafka安裝 kafka集群搭建 kafka zookeeper kafka原理 librdkafka kafka集群 spring-kafka apache kafka 3年只用就是 icp c語言注釋轉(zhuǎn)換 time ipo 輸出 pso 502 hashset

AI
助
手

產(chǎn)品服務(wù)

云服務(wù)器

高防服務(wù)器

高防IP

裸金屬服務(wù)器

機柜租用

SSL證書

高防CDN

彈性IP

地區(qū)劃分

中國香港服務(wù)器

美國服務(wù)器

德國服務(wù)器

日本服務(wù)器

韓國服務(wù)器

新加坡服務(wù)器

專題活動

控制臺

應(yīng)用市場

最新活動

九馬智能直播

幫助支持

幫助中心

網(wǎng)站備案

法律條款

全國服務(wù)

安全漏洞

主題地圖

關(guān)于我們

關(guān)于億速云

客戶案例

新聞資訊

資訊地圖

問答地圖

聯(lián)系我們

人才招聘

售后咨詢

7*24小時在線電話：400-100-2938

7*24小時在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機網(wǎng)站二維碼

Copyright ? Yisu Cloud Ltd. All Rights Reserved. 2018 版權(quán)所有

廣州億速云計算有限公司粵ICP備17096448號-1 粵公網(wǎng)安備 44010402001142號增值電信業(yè)務(wù)經(jīng)營許可證編號：B1-20181529

感谢您访问我们的网站，您可能还对以下资源感兴趣：
被侍卫玩的丫鬟高h

<track id="tnhzo"><kbd id="tnhzo"></kbd></track>