您好,登錄后才能下訂單哦!
這篇文章主要為大家展示了“hadoop框架結(jié)構(gòu)核心是什么”,內(nèi)容簡(jiǎn)而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領(lǐng)大家一起研究并學(xué)習(xí)一下“hadoop框架結(jié)構(gòu)核心是什么”這篇文章吧。
圖示:DKhadoop技術(shù)技術(shù)架構(gòu)圖
hadoop框架結(jié)構(gòu)核心:
hadoop的框架結(jié)構(gòu)最核心的設(shè)計(jì)就是:HDFS和MapReduce。HDFS為海量的數(shù)據(jù)提供了存儲(chǔ),MapReduce為海量的數(shù)據(jù)提供了計(jì)算。
大數(shù)據(jù)一體化開(kāi)發(fā)框架:
大數(shù)據(jù)的應(yīng)用開(kāi)發(fā)過(guò)于偏向底層,設(shè)計(jì)技術(shù)面非常廣泛,學(xué)習(xí)的難度自然要大的很多。對(duì)于新手入門(mén)更是難上加難。DKhadoop則是大快搜索將一系列技術(shù)框架在底層進(jìn)行了重新封裝。把大數(shù)據(jù)開(kāi)發(fā)中的一些通用的,重復(fù)使用的基礎(chǔ)代碼、算法封裝為類(lèi)庫(kù),降低了大俗局的學(xué)習(xí)門(mén)檻,降低開(kāi)發(fā)難度。
DKhadoop框架結(jié)構(gòu)構(gòu)成模塊:
我們以DKhadoop發(fā)行版為例:
1、框架由:數(shù)據(jù)源與SQL引擎、數(shù)據(jù)采集(自定義爬蟲(chóng))模塊、數(shù)據(jù)處理模塊、機(jī)器學(xué)習(xí)算法、自然語(yǔ)言處理模塊、搜索引擎模塊,六部分組成。
2、大快的大數(shù)據(jù)通用計(jì)算平臺(tái)(DKH),已經(jīng)集成相同版本號(hào)的開(kāi)發(fā)框架的全部組件。如果在開(kāi)源大數(shù)據(jù)框架上部署大快的開(kāi)發(fā)框架,需要平臺(tái)的組件支持如下:
(1)數(shù)據(jù)源與SQL引擎:DK.Hadoop、spark、hive、sqoop、flume、kafka
(2)數(shù)據(jù)采集:DK.hadoop
(3)數(shù)據(jù)處理模塊:DK.Hadoop、spark、storm、hive
(4)機(jī)器學(xué)習(xí)和AI:DK.Hadoop、spark
(5)NLP模塊:上傳服務(wù)器端JAR包,直接支持
(6)搜索引擎模塊:不獨(dú)立發(fā)布
Dkhadoop是大快深度整合,重新編譯后的HADOOP發(fā)行版,可單獨(dú)發(fā)布。獨(dú)立部署FreeRCH(大快大數(shù)據(jù)一體化開(kāi)發(fā)框架)時(shí),必需的組件。DK.HADOOP整合集成了NOSQL數(shù)據(jù)庫(kù),簡(jiǎn)化了文件系統(tǒng)與非關(guān)系數(shù)據(jù)庫(kù)之間的編程;DK.HADOOP改進(jìn)了集群同步系統(tǒng),使得HADOOP的數(shù)據(jù)處理更加高效。
以上是“hadoop框架結(jié)構(gòu)核心是什么”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對(duì)大家有所幫助,如果還想學(xué)習(xí)更多知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。