您好,登錄后才能下訂單哦!
Kafka官網(wǎng)自己的介紹是:一個可支持分布式的流平臺。
kafka官網(wǎng)介紹
kafka三個關鍵能力:
1.發(fā)布訂閱記錄流,類似于消息隊列與企業(yè)信息系統(tǒng)
2.以容錯的持久方式存儲記錄流
3.對流進行處理
kafka通常應用再兩大類應用中:
1.構建實時流數(shù)據(jù)管道,在系統(tǒng)或應用程序之間可靠地獲取數(shù)據(jù)
2.構建轉(zhuǎn)換或響應數(shù)據(jù)流的實時流應用程序
kafka的一些基本概念:
1.Kafka作為一個集群運行在一個或多個服務器上,這些服務器可以跨越多個數(shù)據(jù)中心。
2.Kafka集群將記錄流存儲在稱為topic的類別中。
3.每個記錄由一個鍵、一個值和一個時間戳組成。
kafka核心API:
1.Producer API:允許應用程序?qū)⒂涗浟靼l(fā)布到一個或多個topic。
2.Consumer API:允許應用程序訂閱一個或多個topic并處理生成給它們的記錄流。
3.Streams API:允許應用程序充當流處理器,使用來自一個或多個topic的輸入流,
并生成一個或多個輸出topic的輸出流,從而有效地將輸入流轉(zhuǎn)換為輸出流。
4.Connector API:允許構建和運行可重用的生產(chǎn)者或消費者,將topic連接到現(xiàn)有的應用程序或數(shù)據(jù)系統(tǒng)。
例如,到關系數(shù)據(jù)庫的連接器可能捕獲對表的每個更改。
傳統(tǒng)消息傳遞有兩類模型:消息隊列、發(fā)布訂閱。在消息隊列中,一個消費者池可以從一個服務器讀取數(shù)據(jù),而每個記錄都將被發(fā)送到其中一個服務器;在發(fā)布-訂閱中,記錄被廣播給所有消費者。這兩種模型各有優(yōu)缺點:
消息隊列優(yōu)缺點:
它允許您在多個使用者實例上劃分數(shù)據(jù)處理,這使您可以擴展處理。
隊列不是多訂閱者的—一旦一個進程讀取了它丟失的數(shù)據(jù)。
發(fā)布訂閱優(yōu)缺點:
Publish-subscribe允許您將數(shù)據(jù)廣播到多個進程,
但是由于每個消息都傳遞到每個訂閱者,因此無法擴展處理。
作為消息傳遞系統(tǒng),那么跟mq有什么區(qū)別呢?(RabbitMq\redis\RocketMq\ActiveMq)
RabbitMQ:
遵循AMQP協(xié)議,由內(nèi)在高并發(fā)的erlang語言開發(fā),用在實時的對可靠性要求比較高的消息傳遞上.
萬級數(shù)據(jù)量,社區(qū)活躍度極高,可視化操作界面豐富。
提供了全面的核心功能,是消息隊列的優(yōu)秀產(chǎn)品。
因為是erlang語言開發(fā),難以維護并且開發(fā)者很難二次開發(fā)。
Redis:
redis的主要場景是內(nèi)存數(shù)據(jù)庫,作為消息隊列來說可靠性太差,而且速度太依賴網(wǎng)絡IO。
在服務器本機上的速度較快,且容易出現(xiàn)數(shù)據(jù)堆積的問題,在比較輕量的場合下能夠適用。
RocketMq:
rocketMq幾十萬級別數(shù)據(jù)量,基于Java開發(fā)。是阿里巴巴開源的一個消息產(chǎn)品。
應對了淘寶雙十一考驗,并且文檔十分的完善,擁有一些其他消息隊列不具備的高級特性,
如定時推送,其他消息隊列是延遲推送,如rabbitMq通過設置expire字段設置延遲推送時間。
又比如rocketmq實現(xiàn)分布式事務,比較可靠的。RocketMq也是用過的唯一支持分布式事務的一款產(chǎn)品。
Kafka:
kafka原本設計的初衷是日志統(tǒng)計分析,現(xiàn)在基于大數(shù)據(jù)的背景下也可以做運營數(shù)據(jù)的分析統(tǒng)計。
kafka真正的大規(guī)模分布式消息隊列,提供的核心功能比較少?;趜ookeeper實現(xiàn)的分布式消息訂閱。
幾十萬級數(shù)據(jù)量級,比RokectMq更強。
客戶端和服務器之間的通信是通過一個簡單的、高性能的、語言無關的TCP協(xié)議來完成的。
ActiveMq:
Apache ActiveMQ?是最流行的開源、多協(xié)議、基于java的消息服務器。它支持行業(yè)標準協(xié)議,
因此用戶可以在各種語言和平臺上選擇客戶端??梢允褂脕碜訡、c++、Python、. net等的連接性。
使用通用的AMQP協(xié)議集成您的多平臺應用程序。使用STOMP在websockets上交換web應用程序之間的消息。
使用MQTT管理物聯(lián)網(wǎng)設備。支持您現(xiàn)有的JMS基礎結構及其他。ActiveMQ提供了支持任何messagi的強大功能
和靈活性。
備注:因為該文章主要介紹kafka,所以上述只是簡單羅列了一些特點,如果有興趣的同學可以詳細的分析一下,這些產(chǎn)品我后續(xù)都會專門寫文章來歸納總結分析,在這里先簡單帶過。
該部分是擴展內(nèi)容,很多人包括我剛畢業(yè)那年使用消息隊列,但別人問道我為啥用消息隊列,我都沒有一個很清晰的認識,所以在這里也說一下。希望給有需要的同學一些幫助。
那么為什么要使用消息隊列呢?首先我們來回顧一下消息傳遞。前端而言,傳統(tǒng)方式是通過全局變量來傳遞,后面有了數(shù)據(jù)總線的概念,再后來有相應的解決方案產(chǎn)品比如說vuex、redux、store等。對于后端來說,最先系統(tǒng)之間的通信,消息傳遞都非常依賴于通信對象彼此,高度耦合,后面有了一些產(chǎn)品來解決這些問題,比如說webservice.但這樣的方式極其不友好,而且維護繁瑣,職責難以分清,工作量增加,所以mq誕生后,基本解決了這些問題。
消息隊列的引入是為了:
1.解耦:
比如:A系統(tǒng)操作p,需要將消息傳遞給B、C兩個系統(tǒng),如果沒有消息隊列,那么A系統(tǒng)中需要給B發(fā)一條消息,
又得給C發(fā)一條消息,然后有一天D、E、F系統(tǒng)說:A系統(tǒng)你也要給我發(fā)p的消息,這個時候A又得修改代碼,
發(fā)布上線,DEF才能正常接收消息。然后過了n天,C又說,不要給我發(fā)消息了,把給我發(fā)消息的部分去掉吧。
A系統(tǒng)的開發(fā)人員又得哐哧哐哧的去掉,發(fā)布上線。這樣日復一日,隨著系統(tǒng)增多,接入和退出的操作增多,
那么A系統(tǒng)需要頻繁發(fā)布上線,降低了穩(wěn)定性、可用時間、同時每次上線都需要測試跟蹤測試,這里面的成本
與風險不言而喻。而消息隊列一旦引入,A不需要關心誰消費,誰退出消費,A只負責將消息放入隊列即可,
而其他系統(tǒng)只需要監(jiān)聽這個隊列,就算其他系統(tǒng)退出,對A而言也是沒有任何影響的,能夠一直持續(xù)不斷的
提供服務,這難道不香嗎?
2.異步
比如說:傳統(tǒng)方式發(fā)送消息給B、C、D,需要120ms,那么如果采用了消息隊列,就可以大大降低耗時。但
這些對于那些非必要的同步業(yè)務邏輯適用。
3.削峰
傳統(tǒng)模式下,請求直接進入到數(shù)據(jù)庫,當峰值到達一定時,必然會掛掉。如果適用了中間件消息隊列,那么就可以很好的保證系統(tǒng)正常提供服務,這也是秒殺系統(tǒng)中會常常談到的限流、這樣可以防止系統(tǒng)崩潰,提供系統(tǒng)可用性。
<dependency>
<groupId>org.apache.kafka</groupId>
<artifactId>kafka_2.12</artifactId>
<version>1.0.0</version>
<scope>provided</scope>
</dependency>
<dependency>
<groupId>org.apache.kafka</groupId>
<artifactId>kafka-clients</artifactId>
<version>1.0.0</version>
</dependency>
<dependency>
<groupId>org.apache.kafka</groupId>
<artifactId>kafka-streams</artifactId>
<version>1.0.0</version>
</dependency>
/**
* @author chandlerHuang
* @description @TODO
* @date 2020/1/15
*/
public class KafkaProducerService implements Runnable {
private final KafkaProducer<String,String> producer;
private final String topic;
public KafkaProducerService(String topic) {
Properties props = new Properties();
props.put("bootstrap.servers", "綁定的外網(wǎng)IP:9092");
props.put("acks", "all");
props.put("retries", 0);
props.put("batch.size", 16384);
props.put("key.serializer", StringSerializer.class.getName());
props.put("value.serializer", StringSerializer.class.getName());
this.producer = new KafkaProducer<String, String>(props);
this.topic = topic;
}
@Override
public void run() {
int messageNo = 1;
try {
for(;;) {
String messageStr="["+messageNo+"]:hello,boys!";
producer.send(new ProducerRecord<String, String>(topic, "Message", messageStr));
//生產(chǎn)了100條就打印
if(messageNo%100==0){
System.out.println("sendMessages:" + messageStr);
}
//生產(chǎn)1000條就退出
if(messageNo%1000==0){
System.out.println("successCount:"+messageNo);
break;
}
messageNo++;
}
} catch (Exception e) {
e.printStackTrace();
} finally {
producer.close();
}
}
public static void main(String args[]) {
KafkaProducerService test = new KafkaProducerService(TopicConstant.CHART_TOPIC);
Thread thread = new Thread(test);
thread.start();
}
}
/**
* @author chandlerHuang
* @description @TODO
* @date 2020/1/15
*/
public class KafkaConsumerService implements Runnable{
private final KafkaConsumer<String, String> consumer;
private ConsumerRecords<String, String> msgList;
private final String topic;
private static final String GROUPID = "groupA";
public KafkaConsumerService(String topicName) {
Properties props = new Properties();
props.put("bootstrap.servers", "綁定的外網(wǎng)IP:9092");
props.put("group.id", GROUPID);
props.put("enable.auto.commit", "true");
props.put("auto.commit.interval.ms", "1000");
props.put("session.timeout.ms", "30000");
props.put("auto.offset.reset", "earliest");
props.put("key.deserializer", StringDeserializer.class.getName());
props.put("value.deserializer", StringDeserializer.class.getName());
this.consumer = new KafkaConsumer<String, String>(props);
this.topic = topicName;
this.consumer.subscribe(Arrays.asList(topic));
}
@Override
public void run() {
int messageNo = 1;
System.out.println("---------開始消費---------");
try {
for (;;) {
msgList = consumer.poll(1000);
if(null!=msgList&&msgList.count()>0){
for (ConsumerRecord<String, String> record : msgList) {
//消費100條就打印 ,但打印的數(shù)據(jù)不一定是這個規(guī)律的
if(messageNo%100==0){
System.out.println(messageNo+"=======receive: key = " + record.key() + ", value = " + record.value()+" offset==="+record.offset());
}
//當消費了1000條就退出
if(messageNo%1000==0){
break;
}
messageNo++;
}
}else{
Thread.sleep(1000);
}
}
} catch (InterruptedException e) {
e.printStackTrace();
} finally {
consumer.close();
}
}
public static void main(String args[]) {
KafkaConsumerService test1 = new KafkaConsumerService(TopicConstant.CHART_TOPIC);
Thread thread1 = new Thread(test1);
thread1.start();
}
}
備注:上述demo編寫過程中,發(fā)現(xiàn)報了一個Exception:Kafka java client 連接異常(org.apache.kafka.common.errors.TimeoutException: Failed to update metadata )...
kafka中需要配置server.文件:
advertised.listeners=PLAINTEXT://外網(wǎng)地址:9092
zookeeper.connect=內(nèi)網(wǎng)地址:2181
如果你是云服務器的話需要,在安全組設置對應端口開放,否則無法訪問響應接口!
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。