您好,登錄后才能下訂單哦!
大數(shù)據(jù)入門學(xué)習(xí)之Hadoop技術(shù)優(yōu)缺點
(1)Hadoop具有按位存儲和處理數(shù)據(jù)能力的高可靠性。
(2)Hadoop通過可用的計算機(jī)集群分配數(shù)據(jù),完成存儲和計算任務(wù),這些集群可以方便地擴(kuò)展到數(shù)以千計的節(jié)點中,具有高擴(kuò)展性。
(3)Hadoop能夠在節(jié)點之間進(jìn)行動態(tài)地移動數(shù)據(jù),并保證各個節(jié)點的動態(tài)平衡,處理速度非常快,具有高效性。
(4)Hadoop能夠自動保存數(shù)據(jù)的多個副本,并且能夠自動將失敗的任務(wù)重新分配,具有高容錯性。
.在入門學(xué)習(xí)大數(shù)據(jù)的過程當(dāng)中有遇見學(xué)習(xí),行業(yè),缺乏系統(tǒng)學(xué)習(xí)路線,系統(tǒng)學(xué)習(xí)規(guī)劃,歡迎你加入我的大數(shù)據(jù)學(xué)習(xí)交流裙:529867072 ,裙文件有我這幾年整理的大數(shù)據(jù)學(xué)習(xí)手冊,開發(fā)工具,PDF文檔書籍,你可以自行下載。
Hadoop的缺點
(1)Hadoop不適用于低延遲數(shù)據(jù)訪問。
(2)Hadoop不能高效存儲大量小文件。
(3)Hadoop不支持多用戶寫入并任意修改文件。
Hadoop的核心組件
Hadoop自誕生以來,主要出現(xiàn)了Hadoop1、Hadoop2、Hadoop3三個系列多個版本。
HDFS和MapReduce是Hadoop1的核心組件,Hadoop生態(tài)圈里的很多組件都是基于HDFS和MapReduce發(fā)展出來的。在繼Hadoop1之后出現(xiàn)了Hadoop2,Hadoop2在Hadoop1的基礎(chǔ)上做了改進(jìn)。相比Hadoop1,Hadoop2的三大核心組件分別是HDFS、MapReduce、Yarn。目前市面上絕大部分企業(yè)使用的是Hadoop2,本書使用的是Hadoop2.7.3這一版本。
Hadoop2的一個公共模塊和三大核心組件組成了四個模塊,簡介如下。
(1)HadoopCommon:為其他Hadoop模塊提供基礎(chǔ)設(shè)施。
(2)HDFS:具有高可靠性、高吞吐量的分布式文件系統(tǒng)。
(3)MapReduce:基于Yarn系統(tǒng),分布式離線并行計算框架。
(4)Yarn:負(fù)責(zé)作業(yè)調(diào)度與集群資源管理的框架。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。