溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Spark Streaming結(jié)合Flume和Kafka的日志分析是怎樣的

發(fā)布時間:2021-12-15 10:13:54 來源:億速云 閱讀:185 作者:柒染 欄目:云計算

今天就跟大家聊聊有關(guān)Spark Streaming結(jié)合Flume和Kafka的日志分析是怎樣的,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

Spark Streaming結(jié)合Flume、Kafka的日志分析

1.修改相應(yīng)的配置文件

按照 http://my.oschina.net/sunmin/blog/692994

整合安裝Flume+Kafka+SparkStreaming

將flume/conf/producer.conf將需要監(jiān)控的日志輸出文件修改為本地的log 路徑:
/var/log/nginx/www.eric.aysaas.com-access.log

2.導(dǎo)入相關(guān) jar 包

(快捷鍵 Ctrl + Alt + Shift + s),點擊Project Structure界面左側(cè)的“Modules”顯示下圖界面

Spark Streaming結(jié)合Flume和Kafka的日志分析是怎樣的

jar 包自己編譯,或者去載  http://search.maven.org/#search|ga|1|g%3A%22org.apache.spark%22%20AND%20v%3A%221.6.1%22

3.新建log/KafkaTest.scala 代碼如下

import kafka.serializer.StringDecoder
import org.apache.spark.SparkConf
import org.apache.spark.streaming.dstream.DStream
import org.apache.spark.streaming.{Seconds, StreamingContext}
import org.apache.spark.streaming.kafka.KafkaUtils

/**
  * flume+kafka+SparkStreaming 實時 nginx 日志獲取
  * Created by eric on 16/6/29.
  */
object KafkaLog {

  def main(agrs: Array[String]): Unit = {

    val sparkConf = new SparkConf().setMaster("local[1]").setAppName("StreamingTest")
    val ssc = new StreamingContext(sparkConf, Seconds(20))//代表一個給定的秒數(shù)的實例

    val topic = "HappyBirthDayToAnYuan"
    val topicSet = topic.split(" ").toSet

    //用 brokers and topics 創(chuàng)建 direct kafka stream
    val kafkaParams = Map[String, String]("metadata.broker.list" -> "localhost:9092")

    //直接從 kafka brokers 拉取信息,而不使用任何接收器.
    val messages = KafkaUtils.createDirectStream[String, String, StringDecoder, StringDecoder](
      ssc, kafkaParams, topicSet
    )
    val lines = messages.map(_._2)
    lines.print()
    val words: DStream[String] = lines.flatMap(_.split("\n"))
    words.count().print()

    //啟動
    ssc.start()
    ssc.awaitTermination()
  }
}

4.Test

訪問本地頁面產(chǎn)生日志 http://www.eric.aysaas.com/app/admin

在這20秒內(nèi)總共產(chǎn)生的日志行數(shù)為:

Spark Streaming結(jié)合Flume和Kafka的日志分析是怎樣的

看完上述內(nèi)容,你們對Spark Streaming結(jié)合Flume和Kafka的日志分析是怎樣的有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI