消息中間件選型分析 —— 從 Kafka 與 RabbitMQ 的對比來看全局

發(fā)布時間：2020-10-12 13:53:04 來源：網(wǎng)絡閱讀：1548 作者：Java_老男孩欄目：編程語言

一、前言

消息隊列中間件（簡稱消息中間件）是指利用高效可靠的消息傳遞機制進行與平臺無關的數(shù)據(jù)交流，并基于數(shù)據(jù)通信來進行分布式系統(tǒng)的集成。通過提供消息傳遞和消息排隊模型，它可以在分布式環(huán)境下提供應用解耦、彈性伸縮、冗余存儲、流量削峰、異步通信、數(shù)據(jù)同步等等功能，其作為分布式系統(tǒng)架構中的一個重要組件，有著舉足輕重的地位。

目前開源的消息中間件可謂是琳瑯滿目，能讓大家耳熟能詳?shù)木陀泻芏?，比如ActiveMQ、RabbitMQ、Kafka、RocketMQ、ZeroMQ等。不管選擇其中的哪一款，都會有用的不趁手的地方，畢竟不是為你量身定制的。有些大廠在長期的使用過程中積累了一定的經(jīng)驗，其消息隊列的使用場景也相對穩(wěn)定固化，或者目前市面上的消息中間件無法滿足自身需求，并且也具備足夠的精力和人力而選擇自研來為自己量身打造一款消息中間件。但是絕大多數(shù)公司還是不會選擇重復造輪子，那么選擇一款合適自己的消息中間件顯得尤為重要。就算是前者，那么在自研出穩(wěn)定且可靠的相關產(chǎn)品之前還是會經(jīng)歷這樣一個選型過程。

在整體架構中引入消息中間件，勢必要考慮很多因素，比如成本及收益問題，怎么樣才能達到最優(yōu)的性價比？雖然消息中間件種類繁多，但是各自都有各自的側重點，選擇合適自己、揚長避短無疑是最好的方式。如果你對此感到無所適從，本文或許可以參考一二。

二、各類消息隊列簡述

ActiveMQ是Apache出品的、采用Java語言編寫的完全基于JMS1.1規(guī)范的面向消息的中間件，為應用程序提供高效的、可擴展的、穩(wěn)定的和安全的企業(yè)級消息通信。不過由于歷史原因包袱太重，目前市場份額沒有后面三種消息中間件多，其最新架構被命名為Apollo，號稱下一代ActiveMQ，有興趣的同學可行了解。

RabbitMQ是采用Erlang語言實現(xiàn)的AMQP協(xié)議的消息中間件，最初起源于金融系統(tǒng)，用于在分布式系統(tǒng)中存儲轉(zhuǎn)發(fā)消息。RabbitMQ發(fā)展到今天，被越來越多的人認可，這和它在可靠性、可用性、擴展性、功能豐富等方面的卓越表現(xiàn)是分不開的。

Kafka起初是由LinkedIn公司采用Scala語言開發(fā)的一個分布式、多分區(qū)、多副本且基于zookeeper協(xié)調(diào)的分布式消息系統(tǒng)，現(xiàn)已捐獻給Apache基金會。它是一種高吞吐量的分布式發(fā)布訂閱消息系統(tǒng)，以可水平擴展和高吞吐率而被廣泛使用。目前越來越多的開源分布式處理系統(tǒng)如Cloudera、Apache Storm、Spark、Flink等都支持與Kafka集成。

RocketMQ是阿里開源的消息中間件，目前已經(jīng)捐獻個Apache基金會，它是由Java語言開發(fā)的，具備高吞吐量、高可用性、適合大規(guī)模分布式系統(tǒng)應用等特點，經(jīng)歷過雙11的洗禮，實力不容小覷。

ZeroMQ號稱史上最快的消息隊列，基于C語言開發(fā)。ZeroMQ是一個消息處理隊列庫，可在多線程、多內(nèi)核和主機之間彈性伸縮，雖然大多數(shù)時候我們習慣將其歸入消息隊列家族之中，但是其和前面的幾款有著本質(zhì)的區(qū)別，ZeroMQ本身就不是一個消息隊列服務器，更像是一組底層網(wǎng)絡通訊庫，對原有的Socket API上加上一層封裝而已。

目前市面上的消息中間件還有很多，比如騰訊系的PhxQueue、CMQ、CKafka，又比如基于Go語言的NSQ，有時人們也把類似Redis的產(chǎn)品也看做消息中間件的一種，當然它們都很優(yōu)秀，但是本文篇幅限制無法窮極所有，下面會針對性的挑選RabbitMQ和Kafka兩款典型的消息中間件來做分析，力求站在一個公平公正的立場來闡述消息中間件選型中的各個要點。

三、選型要點概述

衡量一款消息中間件是否符合需求需要從多個維度進行考察，首要的就是功能維度，這個直接決定了你能否最大程度上的實現(xiàn)開箱即用，進而縮短項目周期、降低成本等。如果一款消息中間件的功能達不到想要的功能，那么就需要進行二次開發(fā)，這樣會增加項目的技術難度、復雜度以及增大項目周期等。

1. 功能維度

功能維度又可以劃分個多個子維度，大致可以分為以下這些：

優(yōu)先級隊列

優(yōu)先級隊列不同于先進先出隊列，優(yōu)先級高的消息具備優(yōu)先被消費的特權，這樣可以為下游提供不同消息級別的保證。不過這個優(yōu)先級也是需要有一個前提的：如果消費者的消費速度大于生產(chǎn)者的速度，并且消息中間件服務器（一般簡單的稱之為Broker）中沒有消息堆積，那么對于發(fā)送的消息設置優(yōu)先級也就沒有什么實質(zhì)性的意義了，因為生產(chǎn)者剛發(fā)送完一條消息就被消費者消費了，那么就相當于Broker中至多只有一條消息，對于單條消息來說優(yōu)先級是沒有什么意義的。

延遲隊列

當你在網(wǎng)上購物的時候是否會遇到這樣的提示：“三十分鐘之內(nèi)未付款，訂單自動取消”？這個是延遲隊列的一種典型應用場景。延遲隊列存儲的是對應的延遲消息，所謂“延遲消息”是指當消息被發(fā)送以后，并不想讓消費者立刻拿到消息，而是等待特定時間后，消費者才能拿到這個消息進行消費。延遲隊列一般分為兩種：基于消息的延遲和基于隊列的延遲?；谙⒌难舆t是指為每條消息設置不同的延遲時間，那么每當隊列中有新消息進入的時候就會重新根據(jù)延遲時間排序，當然這也會對性能造成極大的影響。實際應用中大多采用基于隊列的延遲，設置不同延遲級別的隊列，比如5s、10s、30s、1min、5mins、10mins等，每個隊列中消息的延遲時間都是相同的，這樣免去了延遲排序所要承受的性能之苦，通過一定的掃描策略（比如定時）即可投遞超時的消息。

死信隊列

由于某些原因消息無法被正確的投遞，為了確保消息不會被無故的丟棄，一般將其置于一個特殊角色的隊列，這個隊列一般稱之為死信隊列。與此對應的還有一個“回退隊列”的概念，試想如果消費者在消費時發(fā)生了異常，那么就不會對這一次消費進行確認（Ack）,進而發(fā)生回滾消息的操作之后消息始終會放在隊列的頂部，然后不斷被處理和回滾，導致隊列陷入死循環(huán)。為了解決這個問題，可以為每個隊列設置一個回退隊列，它和死信隊列都是為異常的處理提供的一種機制保障。實際情況下，回退隊列的角色可以由死信隊列和重試隊列來扮演。

重試隊列

重試隊列其實可以看成是一種回退隊列，具體指消費端消費消息失敗時，為防止消息無故丟失而重新將消息回滾到Broker中。與回退隊列不同的是重試隊列一般分成多個重試等級，每個重試等級一般也會設置重新投遞延時，重試次數(shù)越多投遞延時就越大。舉個例子：消息第一次消費失敗入重試隊列Q1，Q1的重新投遞延遲為5s，在5s過后重新投遞該消息；如果消息再次消費失敗則入重試隊列Q2，Q2的重新投遞延遲為10s，在10s過后再次投遞該消息。以此類推，重試越多次重新投遞的時間就越久，為此需要設置一個上限，超過投遞次數(shù)就入死信隊列。重試隊列與延遲隊列有相同的地方，都是需要設置延遲級別，它們彼此的區(qū)別是：延遲隊列動作由內(nèi)部觸發(fā)，重試隊列動作由外部消費端觸發(fā)；延遲隊列作用一次，而重試隊列的作用范圍會向后傳遞。

消費模式

消費模式分為推（push）模式和拉（pull）模式。推模式是指由Broker主動推送消息至消費端，實時性較好，不過需要一定的流制機制來確保服務端推送過來的消息不會壓垮消費端。而拉模式是指消費端主動向Broker端請求拉?。ㄒ话闶嵌〞r或者定量）消息，實時性較推模式差，但是可以根據(jù)自身的處理能力而控制拉取的消息量。

廣播消費

消息一般有兩種傳遞模式：點對點（P2P，Point-to-Point）模式和發(fā)布/訂閱（Pub/Sub）模式。對于點對點的模式而言，消息被消費以后，隊列中不會再存儲，所以消息消費者不可能消費到已經(jīng)被消費的消息。雖然隊列可以支持多個消費者，但是一條消息只會被一個消費者消費。發(fā)布訂閱模式定義了如何向一個內(nèi)容節(jié)點發(fā)布和訂閱消息，這個內(nèi)容節(jié)點稱為主題（topic），主題可以認為是消息傳遞的中介，消息發(fā)布者將消息發(fā)布到某個主題，而消息訂閱者則從主題中訂閱消息。主題使得消息的訂閱者與消息的發(fā)布者互相保持獨立，不需要進行接觸即可保證消息的傳遞，發(fā)布/訂閱模式在消息的一對多廣播時采用。RabbitMQ是一種典型的點對點模式，而Kafka是一種典型的發(fā)布訂閱模式。但是RabbitMQ中可以通過設置交換器類型來實現(xiàn)發(fā)布訂閱模式而達到廣播消費的效果，Kafka中也能以點對點的形式消費，你完全可以把其消費組（consumer group）的概念看成是隊列的概念。不過對比來說，Kafka中因為有了消息回溯功能的存在，對于廣播消費的力度支持比RabbitMQ的要強。

消息回溯

一般消息在消費完成之后就被處理了，之后再也不能消費到該條消息。消息回溯正好相反，是指消息在消費完成之后，還能消費到之前被消費掉的消息。對于消息而言，經(jīng)常面臨的問題是“消息丟失”，至于是真正由于消息中間件的缺陷丟失還是由于使用方的誤用而丟失一般很難追查，如果消息中間件本身具備消息回溯功能的話，可以通過回溯消費復現(xiàn)“丟失的”消息進而查出問題的源頭之所在。消息回溯的作用遠不止與此，比如還有索引恢復、本地緩存重建，有些業(yè)務補償方案也可以采用回溯的方式來實現(xiàn)。

消息堆積+持久化

流量削峰是消息中間件的一個非常重要的功能，而這個功能其實得益于其消息堆積能力。從某種意義上來講，如果一個消息中間件不具備消息堆積的能力，那么就不能把它看做是一個合格的消息中間件。消息堆積分內(nèi)存式堆積和磁盤式堆積。RabbitMQ是典型的內(nèi)存式堆積，但這并非絕對，在某些條件觸發(fā)后會有換頁動作來將內(nèi)存中的消息換頁到磁盤（換頁動作會影響吞吐），或者直接使用惰性隊列來將消息直接持久化至磁盤中。Kafka是一種典型的磁盤式堆積，所有的消息都存儲在磁盤中。一般來說，磁盤的容量會比內(nèi)存的容量要大得多，對于磁盤式的堆積其堆積能力就是整個磁盤的大小。從另外一個角度講，消息堆積也為消息中間件提供了冗余存儲的功能。援引紐約時報的案例，其直接將Kafka用作存儲系統(tǒng)。

消息追蹤

對于分布式架構系統(tǒng)中的鏈路追蹤（trace）而言，大家一定不會陌生。對于消息中間件而言，消息的鏈路追蹤（以下簡稱消息追蹤）同樣重要。對于消息追蹤最通俗的理解就是要知道消息從哪來，存在哪里以及發(fā)往哪里去。基于此功能下，我們可以對發(fā)送或者消費完的消息進行鏈路追蹤服務，進而可以進行問題的快速定位與排查。

消息過濾

消息過濾是指按照既定的過濾規(guī)則為下游用戶提供指定類別的消息。就以kafka而言，完全可以將不同類別的消息發(fā)送至不同的topic中，由此可以實現(xiàn)某種意義的消息過濾，或者Kafka還可以根據(jù)分區(qū)對同一個topic中的消息進行分類。不過更加嚴格意義上的消息過濾應該是對既定的消息采取一定的方式按照一定的過濾規(guī)則進行過濾。同樣以Kafka為例，可以通過客戶端提供的ConsumerInterceptor接口或者Kafka Stream的filter功能進行消息過濾。

多租戶

也可以稱為多重租賃技術，是一種軟件架構技術，主要用來實現(xiàn)多用戶的環(huán)境下公用相同的系統(tǒng)或程序組件，并且仍可以確保各用戶間數(shù)據(jù)的隔離性。RabbitMQ就能夠支持多租戶技術，每一個租戶表示為一個vhost，其本質(zhì)上是一個獨立的小型RabbitMQ服務器，又有自己獨立的隊列、交換器及綁定關系等，并且它擁有自己獨立的權限。vhost就像是物理機中的虛擬機一樣，它們在各個實例間提供邏輯上的分離，為不同程序安全保密地允許數(shù)據(jù)，它既能將同一個RabbitMQ中的眾多客戶區(qū)分開，又可以避免隊列和交換器等命名沖突。

多協(xié)議支持

消息是信息的載體，為了讓生產(chǎn)者和消費者都能理解所承載的信息（生產(chǎn)者需要知道如何構造消息，消費者需要知道如何解析消息），它們就需要按照一種統(tǒng)一的格式描述消息，這種統(tǒng)一的格式稱之為消息協(xié)議。有效的消息一定具有某種格式，而沒有格式的消息是沒有意義的。一般消息層面的協(xié)議有AMQP、MQTT、STOMP、XMPP等（消息領域中的JMS更多的是一個規(guī)范而不是一個協(xié)議），支持的協(xié)議越多其應用范圍就會越廣，通用性越強，比如RabbitMQ能夠支持MQTT協(xié)議就讓其在物聯(lián)網(wǎng)應用中獲得一席之地。還有的消息中間件是基于其本身的私有協(xié)議運轉(zhuǎn)的，典型的如Kafka。

跨語言支持

對很多公司而言，其技術棧體系中會有多種編程語言，如C/C++、JAVA、Go、PHP等，消息中間件本身具備應用解耦的特性，如果能夠進一步的支持多客戶端語言，那么就可以將此特性的效能擴大。跨語言的支持力度也可以從側面反映出一個消息中間件的流行程度。

流量控制

流量控制（flow control）針對的是發(fā)送方和接收方速度不匹配的問題，提供一種速度匹配服務抑制發(fā)送速率使接收方應用程序的讀取速率與之相適應。通常的流控方法有Stop-and-wait、滑動窗口以及令牌桶等。

消息順序性

顧名思義，消息順序性是指保證消息有序。這個功能有個很常見的應用場景就是CDC（Change Data Chapture），以MySQL為例，如果其傳輸?shù)腷inlog的順序出錯，比如原本是先對一條數(shù)據(jù)加1，然后再乘以2，發(fā)送錯序之后就變成了先乘以2后加1了，造成了數(shù)據(jù)不一致。

安全機制

在Kafka 0.9版本之后就開始增加了身份認證和權限控制兩種安全機制。身份認證是指客戶端與服務端連接進行身份認證，包括客戶端與Broker之間、Broker與Broker之間、Broker與ZooKeeper之間的連接認證，目前支持SSL、SASL等認證機制。權限控制是指對客戶端的讀寫操作進行權限控制，包括對消息或Kafka集群操作權限控制。權限控制是可插拔的，并支持與外部的授權服務進行集成。對于RabbitMQ而言，其同樣提供身份認證（TLS/SSL、SASL）和權限控制（讀寫操作）的安全機制。

消息冪等性

對于確保消息在生產(chǎn)者和消費者之間進行傳輸而言一般有三種傳輸保障（delivery guarantee）：At most once，至多一次，消息可能丟失，但絕不會重復傳輸；At least once，至少一次，消息絕不會丟，但是可能會重復；Exactly once，精確一次，每條消息肯定會被傳輸一次且僅一次。對于大多數(shù)消息中間件而言，一般只提供At most once和At least once兩種傳輸保障，對于第三種一般很難做到，由此消息冪等性也很難保證。

Kafka自0.11版本開始引入了冪等性和事務，Kafka的冪等性是指單個生產(chǎn)者對于單分區(qū)單會話的冪等，而事務可以保證原子性地寫入到多個分區(qū)，即寫入到多個分區(qū)的消息要么全部成功，要么全部回滾，這兩個功能加起來可以讓Kafka具備EOS（Exactly Once Semantic）的能力。

不過如果要考慮全局的冪等，還需要與從上下游方面綜合考慮，即關聯(lián)業(yè)務層面，冪等處理本身也是業(yè)務層面所需要考慮的重要議題。以下游消費者層面為例，有可能消費者消費完一條消息之后沒有來得及確認消息就發(fā)生異常，等到恢復之后又得重新消費原來消費過的那條消息，那么這種類型的消息冪等是無法有消息中間件層面來保證的。如果要保證全局的冪等，需要引入更多的外部資源來保證，比如以訂單號作為唯一性標識，并且在下游設置一個去重表。

事務性消息

事務本身是一個并不陌生的詞匯，事務是由事務開始（Begin Transaction）和事務結束（End Transaction）之間執(zhí)行的全體操作組成。支持事務的消息中間件并不在少數(shù)，Kafka和RabbitMQ都支持，不過此兩者的事務是指生產(chǎn)者發(fā)生消息的事務，要么發(fā)送成功，要么發(fā)送失敗。消息中間件可以作為用來實現(xiàn)分布式事務的一種手段，但其本身并不提供全局分布式事務的功能。

下表是對Kafka與RabbitMQ功能的總結性對比及補充說明。

功能項	Kafka（1.1.0版本）	RabbitMQ（3.6.10版本）
優(yōu)先級隊列	不支持	支持。建議優(yōu)先級大小設置在0-10之間。
延遲隊列	不支持	支持
死信隊列	不支持	支持
重試隊列	不支持	不支持。RabbitMQ中可以參考延遲隊列實現(xiàn)一個重試隊列，二次封裝比較簡單。如果要在Kafka中實現(xiàn)重試隊列，首先得實現(xiàn)延遲隊列的功能，相對比較復雜。
消費模式	拉模式	推模式+拉模式
廣播消費	支持。Kafka對于廣播消費的支持相對而言更加正統(tǒng)。	支持，但力度較Kafka弱。
消息回溯	支持。Kafka支持按照offset和timestamp兩種維度進行消息回溯。	不支持。RabbitMQ中消息一旦被確認消費就會被標記刪除。
消息堆積	支持	支持。一般情況下，內(nèi)存堆積達到特定閾值時會影響其性能，但這不是絕對的。如果考慮到吞吐這因素，Kafka的堆積效率比RabbitMQ總體上要高很多。
持久化	支持	支持
消息追蹤	不支持。消息追蹤可以通過外部系統(tǒng)來支持，但是支持粒度沒有內(nèi)置的細膩。	支持。RabbitMQ中可以采用Firehose或者rabbitmq_tracing插件實現(xiàn)。不過開啟rabbitmq_tracing插件件會大幅影響性能，不建議生產(chǎn)環(huán)境開啟，反倒是可以使用Firehose與外部鏈路系統(tǒng)結合提供高細膩度的消息追蹤支持。
消息過濾	客戶端級別的支持	不支持。但是二次封裝一下也非常簡單。
多租戶	不支持	支持
多協(xié)議支持	只支持定義協(xié)議，目前幾個主流版本間存在兼容性問題。	RabbitMQ本身就是AMQP協(xié)議的實現(xiàn)，同時支持MQTT、STOMP等協(xié)議。
跨語言支持	采用Scala和Java編寫，支持多種語言的客戶端。	采用Erlang編寫，支持多種語言的客戶端。
流量控制	支持client和user級別，通過主動設置可將流控作用于生產(chǎn)者或消費者。	RabbitMQ的流控基于Credit-Based算法，是內(nèi)部被動觸發(fā)的保護機制，作用于生產(chǎn)者層面。
消息順序性	支持單分區(qū)（partition）級別的順序性。	順序性的條件比較苛刻，需要單線程發(fā)送、單線程消費并且不采用延遲隊列、優(yōu)先級隊列等一些高級功能，從某種意義上來說不算支持順序性。
安全機制	（TLS/SSL、SASL）身份認證和（讀寫）權限控制	與Kafka相似
冪等性	支持單個生產(chǎn)者單分區(qū)單會話的冪等性。	不支持
事務性消息	支持	支持

2. 性能

功能維度是消息中間件選型中的一個重要的參考維度，但這并不是唯一的維度。有時候性能比功能還要重要，況且性能和功能很多時候是相悖的，魚和熊掌不可兼得，Kafka在開啟冪等、事務功能的時候會使其性能降低，RabbitMQ在開啟rabbitmq_tracing插件的時候也會極大的影響其性能。消息中間件的性能一般是指其吞吐量，雖然從功能維度上來說，RabbitMQ的優(yōu)勢要大于Kafka，但是Kafka的吞吐量要比RabbitMQ高出1至2個數(shù)量級，一般RabbitMQ的單機QPS在萬級別之內(nèi)，而Kafka的單機QPS可以維持在十萬級別，甚至可以達到百萬級。

消息中間件的吞吐量始終會受到硬件層面的限制。就以網(wǎng)卡帶寬為例，如果單機單網(wǎng)卡的帶寬為1Gbps，如果要達到百萬級的吞吐，那么消息體大小不得超過(1Gb/8)/100W，即約等于134B，換句話說如果消息體大小超過134B，那么就不可能達到百萬級別的吞吐。這種計算方式同樣可以適用于內(nèi)存和磁盤。

時延作為性能維度的一個重要指標，卻往往在消息中間件領域所被忽視，因為一般使用消息中間件的場景對時效性的要求并不是很高，如果要求時效性完全可以采用RPC的方式實現(xiàn)。消息中間件具備消息堆積的能力，消息堆積越大也就意味著端到端的時延也就越長，與此同時延時隊列也是某些消息中間件的一大特色。那么為什么還要關注消息中間件的時延問題呢？消息中間件能夠解耦系統(tǒng)，對于一個時延較低的消息中間件而言，它可以讓上游生產(chǎn)者發(fā)送消息之后可以迅速的返回，也可以讓消費者更加快速的獲取到消息，在沒有堆積的情況下可以讓整體上下游的應用之間的級聯(lián)動作更加高效，雖然不建議在時效性很高的場景下使用消息中間件，但是如果所使用的消息中間件的時延方面比較優(yōu)秀，那么對于整體系統(tǒng)的性能將會是一個不小的提升。

3. 可靠性+可用性

消息丟失是使用消息中間件時所不得不面對的一個同點，其背后消息可靠性也是衡量消息中間件好壞的一個關鍵因素。尤其是在金融支付領域，消息可靠性尤為重要。然而說到可靠性必然要說到可用性，注意這兩者之間的區(qū)別，消息中間件的可靠性是指對消息不丟失的保障程度；而消息中間件的可用性是指無故障運行的時間百分比，通常用幾個9來衡量。

從狹義的角度來說，分布式系統(tǒng)架構是一致性協(xié)議理論的應用實現(xiàn)，對于消息可靠性和可用性而言也可以追溯到消息中間件背后的一致性協(xié)議。對于Kafka而言，其采用的是類似PacificA的一致性協(xié)議，通過ISR（In-Sync-Replica）來保證多副本之間的同步，并且支持強一致性語義（通過acks實現(xiàn)）。對應的RabbitMQ是通過鏡像環(huán)形隊列實現(xiàn)多副本及強一致性語義的。多副本可以保證在master節(jié)點宕機異常之后可以提升slave作為新的master而繼續(xù)提供服務來保障可用性。Kafka設計之初是為日志處理而生，給人們留下了數(shù)據(jù)可靠性要求不要的不良印象，但是隨著版本的升級優(yōu)化，其可靠性得到極大的增強。就目前而言，在金融支付領域使用RabbitMQ居多，而在日志處理、大數(shù)據(jù)等方面Kafka使用居多，隨著RabbitMQ性能的不斷提升和Kafka可靠性的進一步增強，相信彼此都能在以前不擅長的領域分得一杯羹。

同步刷盤是增強一個組件可靠性的有效方式，消息中間件也不例外，Kafka和RabbitMQ都可以支持同步刷盤，但是筆者對同步刷盤有一定的疑問：絕大多數(shù)情景下，一個組件的可靠性不應該由同步刷盤這種極其損耗性能的操作來保障，而是采用多副本的機制來保證。

這里還要提及的一個方面是擴展能力，這里我狹隘地將此歸納到可用性這一維度，消息中間件的擴展能力能夠增強其用可用能力及范圍，比如前面提到的RabbitMQ支持多種消息協(xié)議，這個就是基于其插件化的擴展實現(xiàn)。還有從集群部署上來講，歸功于Kafka的水平擴展能力，其基本上可以達到線性容量提升的水平，在LinkedIn實踐介紹中就提及了有部署超過千臺設備的Kafka集群。

5. 運維管理

在消息中間件的使用過程中難免會出現(xiàn)各式各樣的異常情況，有客戶端的，也有服務端的，那么怎樣及時有效的進行監(jiān)測及修復。業(yè)務線流量有峰值又低谷，尤其是電商領域，那么怎樣前進行有效的容量評估，尤其是大促期間？腳踢電源、網(wǎng)線被挖等事件層出不窮，如何有效的做好異地多活？這些都離不開消息中間件的衍生產(chǎn)品——運維管理。

運維管理也可以進行進一步的細分，比如：申請、審核、監(jiān)控、告警、管理、容災、部署等。

申請、審核很好理解，在源頭對資源進行管控，既可以進行有效校正應用方的使用規(guī)范，配和監(jiān)控也可以做好流量統(tǒng)計與流量評估工作，一般申請、審核與公司內(nèi)部系統(tǒng)交融性較大，不適合使用開源類的產(chǎn)品。

監(jiān)控、告警也比較好理解，對消息中間件的使用進行全方位的監(jiān)控，即可以為系統(tǒng)提供基準數(shù)據(jù)，也可以在檢測到異常的情況配合告警，以便運維、開發(fā)人員的迅速介入。除了一般的監(jiān)控項（比如硬件、GC等）之外，對于消息中間件還需要關注端到端時延、消息審計、消息堆積等方面。對于RabbitMQ而言，最正統(tǒng)的監(jiān)控管理工具莫過于rabbitmq_management插件了，但是社區(qū)內(nèi)還有AppDynamics, Collectd, DataDog, Ganglia, Munin, Nagios, New Relic, Prometheus, Zenoss等多種優(yōu)秀的產(chǎn)品。Kafka在此方面也毫不遜色，比如：Kafka Manager, Kafka Monitor, Kafka Offset Monitor, Burrow, Chaperone, Confluent Control Center等產(chǎn)品，尤其是Cruise還可以提供自動化運維的功能。

不管是擴容、降級、版本升級、集群節(jié)點部署、還是故障處理都離不開管理工具的應用，一個配套完備的管理工具集可以在遇到變更時做到事半功倍。故障可大可小，一般是一些應用異常，也可以是機器掉電、網(wǎng)絡異常、磁盤損壞等單機故障，這些故障單機房內(nèi)的多副本足以應付。如果是機房故障就要涉及異地容災了，關鍵點在于如何有效的進行數(shù)據(jù)復制，對于Kafka而言，可以參考MirrorMarker、uReplicator等產(chǎn)品，而RabbitMQ可以參考Federation和Shovel。

6. 社區(qū)力度及生態(tài)發(fā)展

對于目前流行的編程語言而言，如Java、Python，如果你在使用過程中遇到了一些異常，基本上可以通過搜索引擎的幫助來得到解決，因為一個產(chǎn)品用的人越多，踩過的坑也就越多，對應的解決方案也就越多。對于消息中間件也同樣適用，如果你選擇了一種“生僻”的消息中間件，可能在某些方面運用的得心應手，但是版本更新緩慢、遇到棘手問題也難以得到社區(qū)的支持而越陷越深；相反如果你選擇了一種“流行”的消息中間件，其更新力度大，不僅可以迅速的彌補之前的不足，而且也能順應技術的快速發(fā)展來變更一些新的功能，這樣可以讓你以“站在巨人的肩膀上”。在運維管理維度我們提及了Kafka和RabbitMQ都有一系列開源的監(jiān)控管理產(chǎn)品，這些正是得益于其社區(qū)及生態(tài)的迅猛發(fā)展。

四、消息中間件選型誤區(qū)探討

在進行消息中間件選型之前可以先問自己一個問題：是否真的需要一個消息中間件？在搞清楚這個問題之后，還可以繼續(xù)問自己一個問題：是否需要自己維護一套消息中間件？很多初創(chuàng)型公司為了節(jié)省成本會選擇直接購買消息中間件有關的云服務，自己只需要關注收發(fā)消息即可，其余的都可以外包出去。

很多人面對消息中間件時會有一種自研的沖動，你完全可以對Java中的ArrayBlockingQueue做一個簡單的封裝，你也可以基于文件、數(shù)據(jù)庫、Redis等底層存儲封裝而形成一個消息中間件。消息中間件做為一個基礎組件并沒有想象中的那么簡單，其背后還需要配套的管理運維整個生態(tài)的產(chǎn)品集。自研還有會交接問題，如果文檔不齊全、運作不規(guī)范將會帶給新人噩夢般的體驗。是否真的有自研的必要？如果不是KPI的壓迫可以先考慮下這2個問題：1. 目前市面上的消息中間件是否都真的無法滿足目前業(yè)務需求？ 2. 團隊是否有足夠的能力、人力、財力、精力來支持自研？

很多人在做消息中間件選型時會參考網(wǎng)絡上的很多對比類的文章，但是其專業(yè)性、嚴謹性、以及其政治立場問題都有待考證，需要帶著懷疑的態(tài)度去審視這些文章。比如有些文章會在沒有任何限定條件及場景的情況下直接定義某款消息中間件最好，還有些文章沒有指明消息中間件版本及測試環(huán)境就來做功能和性能對比分析，諸如此類的文章都可以唾棄之。

消息中間件猶如小馬過河，選擇合適的才最重要，這需要貼合自身的業(yè)務需求，技術服務于業(yè)務，大體上可以根據(jù)上一節(jié)所提及的功能、性能等6個維度來一一進行篩選。更深層次的抉擇在于你能否掌握其魂，筆者鄙見：RabbitMQ在于routing，而Kafka在于streaming，了解其根本對于自己能夠?qū)ΠY下藥選擇到合適的消息中間件尤為重要。

消息中間件選型切忌一味的追求性能或者功能，性能可以優(yōu)化，功能可以二次開發(fā)。如果要在功能和性能方面做一個抉擇的話，那么首選性能，因為總體上來說性能優(yōu)化的空間沒有功能擴展的空間大。然而對于長期發(fā)展而言，生態(tài)又比性能以及功能都要重要。

很多時候，對于可靠性方面也容易存在一個誤區(qū)：想要找到一個產(chǎn)品來保證消息的絕對可靠，很不幸的是這世界上沒有絕對的東西，只能說盡量趨于完美。想要盡可能的保障消息的可靠性也并非單單只靠消息中間件本身，還要依賴于上下游，需要從生產(chǎn)端、服務端和消費端這3個維度去努力保證，《RabbitMQ消息可靠性分析》這篇文章就從這3個維度去分析了RabbitMQ的可靠性。

消息中間件選型還有一個考量標準就是盡量貼合團隊自身的技術棧體系，雖然說沒有蹩腳的消息中間件只有蹩腳的程序員，但是讓一個C棧的團隊去深挖PhxQueue總比去深挖Scala編寫的Kafka要容易的多。

消息中間件大道至簡：一發(fā)一存一消費，沒有最好的消息中間件，只有最合適的消息中間件。

本文的重點是你有沒有收獲與成長，其余的都不重要，希望讀者們能謹記這一點。同時我經(jīng)過多年的收藏目前也算收集到了一套完整的學習資料，包括但不限于：分布式架構、高可擴展、高性能、高并發(fā)、Jvm性能調(diào)優(yōu)、Spring，MyBatis，Nginx源碼分析，Redis，ActiveMQ、、Mycat、Netty、Kafka、Mysql、Zookeeper、Tomcat、Docker、Dubbo、Nginx等多個知識點高級進階干貨，希望對想成為架構師的朋友有一定的參考和幫助

需要更詳細思維導圖和以下資料的可以加一下技術交流分享群：“708 701 457”免費獲取

消息中間件選型分析 —— 從 Kafka 與 RabbitMQ 的對比來看全局

向AI問一下細節(jié)

消息中間件選型分析 —— 從 Kafka 與 RabbitMQ 的對比來看全局

一、前言

二、各類消息隊列簡述

三、選型要點概述

1. 功能維度

2. 性能

3. 可靠性+可用性

5. 運維管理

6. 社區(qū)力度及生態(tài)發(fā)展

四、消息中間件選型誤區(qū)探討

需要更詳細思維導圖和以下資料的可以加一下技術交流分享群：“708 701 457”免費獲取

猜你喜歡

最新資訊

相關推薦

相關標簽

一、前言

二、各類消息隊列簡述

三、選型要點概述

四、消息中間件選型誤區(qū)探討