您好,登錄后才能下訂單哦!
這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)碛嘘P(guān)大數(shù)據(jù)技術(shù)該怎樣分析,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。
數(shù)據(jù)采集傳輸主要技術(shù)
分為兩類,一類是離線批處理、另一類是實(shí)時(shí)數(shù)據(jù)采集和傳輸
離線批處理最有名的是Sqoop、實(shí)時(shí)數(shù)據(jù)采集和傳輸最為常用的是Flume和Kafka
Sqoop:一款開源的離線數(shù)據(jù)傳輸工具,主要用于Hadoop(Hive)與傳統(tǒng)數(shù)據(jù)庫(kù)(Mysql、Oracle)之間數(shù)據(jù)傳遞。
Flume:實(shí)時(shí)日志采集平臺(tái),一個(gè)高可用、高可靠、分布式的海量日志采集、聚合和傳輸?shù)南到y(tǒng)。
Kafka:通常來說Flume采集數(shù)據(jù)的速度與下游處理數(shù)據(jù)通常不同步,因此實(shí)時(shí)平臺(tái)架構(gòu)都會(huì)用一個(gè)消息中間件進(jìn)行緩沖,這方面使用最廣泛的無疑是Kafka,Kafka是一個(gè)分布式消息系統(tǒng),以其可以水平擴(kuò)展和高吞吐率而被廣泛使用,是基于消息發(fā)布-訂閱系統(tǒng)。和kafka類似的消息中間件產(chǎn)品還包括RabbitMQ、ActiveMQ、ZeroMQ等
數(shù)據(jù)處理主要技術(shù)
MapReduce:運(yùn)行與大規(guī)模集群上的復(fù)雜并行計(jì)算過程高度抽象為兩個(gè)函數(shù):map和reduce。
Hive:是一個(gè)建立在Hadoop體系結(jié)構(gòu)上的一層SQL抽象
Spark:具有可伸縮、基于內(nèi)存計(jì)算等特點(diǎn),可以讀寫Hadoop上任何格式的數(shù)據(jù)。
Strom:實(shí)時(shí)數(shù)據(jù)處理框架,擁有低延遲、分布式、可擴(kuò)展、高容錯(cuò)等特征,可以保證消息不丟(diu)失。
Flink:是一個(gè)同時(shí)面向分布式實(shí)時(shí)流處理和批量數(shù)據(jù)處理的開源計(jì)算平臺(tái),它能夠基于同一個(gè)Flink運(yùn)行時(shí)提供支持流處理和批處理兩種類型應(yīng)用的功能。
Beam:在Flink基礎(chǔ)上更進(jìn)一步,不但希望統(tǒng)一批處理和流處理,而且希望統(tǒng)一大數(shù)據(jù)處理范式和標(biāo)準(zhǔn)。
數(shù)據(jù)儲(chǔ)存主要技術(shù)
HDFS:分布式文件系統(tǒng)。
Hbase:構(gòu)建在HDFS之上的分布式、面向列族的存儲(chǔ)系統(tǒng),在需要實(shí)時(shí)讀寫并隨機(jī)訪問超大規(guī)模數(shù)據(jù)集等場(chǎng)景下,Hbase目前是市場(chǎng)上主流的技術(shù)選擇。
數(shù)據(jù)應(yīng)用技術(shù)
Drill:實(shí)時(shí)大數(shù)據(jù)分布式查詢引擎,Drill兼容ANSI SQL語(yǔ)法作為接口,支撐對(duì)本地文件、HDFS、Hive、HBase、MongeDB作為存儲(chǔ)數(shù)據(jù)查詢,文件格式支持Parquet、CSV、TSV以及JSON這種無模式數(shù)據(jù),所有這些數(shù)據(jù)都可以像使用傳統(tǒng)數(shù)據(jù)庫(kù)的表查詢一樣進(jìn)行快速實(shí)時(shí)查詢。
R:數(shù)據(jù)分析語(yǔ)言
TensorFlow:基于數(shù)據(jù)流圖的處理框架,Tensorflow節(jié)點(diǎn)表示數(shù)據(jù)運(yùn)算,邊表示運(yùn)算節(jié)點(diǎn)之間的數(shù)據(jù)交互。
上述就是小編為大家分享的大數(shù)據(jù)技術(shù)該怎樣分析了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。