您好,登錄后才能下訂單哦!
這篇文章主要介紹了Hadoop2和Hadoop3有什么區(qū)別,具有一定借鑒價值,感興趣的朋友可以參考下,希望大家閱讀完這篇文章之后大有收獲,下面讓小編帶著大家一起了解一下。
Hadoop 2.x與Hadoop 3.x比較
本節(jié)將講述Hadoop 2.x與Hadoop 3.x之間的22個差異。 現(xiàn)在讓我們逐一討論
2.1License
Hadoop 2.x - Apache 2.0,開源
Hadoop 3.x - Apache 2.0,開源
2.2支持的最低Java版本
Hadoop 2.x - java的最低支持版本是java 7
Hadoop 3.x - java的最低支持版本是java 8
2.3容錯
Hadoop 2.x - 可以通過復(fù)制(浪費空間)來處理容錯。
Hadoop 3.x - 可以通過Erasure編碼處理容錯。
2.4數(shù)據(jù)平衡
Hadoop 2.x - 對于數(shù)據(jù)平衡使用HDFS平衡器。
Hadoop 3.x - 對于數(shù)據(jù)平衡使用Intra-data節(jié)點平衡器,該平衡器通過HDFS磁盤平衡器CLI調(diào)用。
2.5存儲Scheme
Hadoop 2.x - 使用3X副本Scheme
Hadoop 3.x - 支持HDFS中的擦除編碼。
2.6存儲開銷
Hadoop 2.x - HDFS在存儲空間中有200%的開銷。
Hadoop 3.x - 存儲開銷僅為50%。
2.7存儲開銷示例
Hadoop 2.x - 如果有6個塊,那么由于副本方案(Scheme),將有18個塊占用空間。
Hadoop 3.x - 如果有6個塊,那么空間9個塊,中6塊空間,3塊用于奇偶校驗。
2.8YARN時間線服務(wù)
Hadoop 2.x - 使用具有可伸縮性問題的舊時間軸服務(wù)。
Hadoop 3.x - 改進時間線服務(wù)v2并提高時間線服務(wù)的可擴展性和可靠性。
2.9默認端口范圍
Hadoop 2.x - 在Hadoop 2.0中,一些默認端口是Linux臨時端口范圍。所以在啟動時,他們將無法綁定。
Hadoop 3.x - 但是在Hadoop 3.0中,這些端口已經(jīng)移出了短暫的范圍。
2.10工具
Hadoop 2.x - 使用Hive,pig,Tez,Hama,Giraph和其他Hadoop工具。
Hadoop 3.x - 可以使用Hive,pig,Tez,Hama,Giraph和其他Hadoop工具。
2.11兼容的文件系統(tǒng)
Hadoop 2.x - HDFS(默認FS),F(xiàn)TP文件系統(tǒng):它將所有數(shù)據(jù)存儲在可遠程訪問的FTP服務(wù)器上。 Amazon S3(簡單存儲服務(wù))文件系統(tǒng)Windows Azure存儲Blob(WASB)文件系統(tǒng)。
Hadoop 3.x - 它支持所有前面以及Microsoft Azure Data Lake文件系統(tǒng)。
2.12Datanode資源
Hadoop 2.x - Datanode資源不專用于MapReduce,我們可以將它用于其他應(yīng)用程序。
Hadoop 3.x - 此處數(shù)據(jù)節(jié)點資源也可用于其他應(yīng)用程序。
2.13MR API兼容性
Hadoop 2.x - 與Hadoop 1.x程序兼容的MR API,可在Hadoop 2.X上執(zhí)行
Hadoop 3.x - 此處,MR API與運行Hadoop 1.x程序兼容,以便在Hadoop 3.X上執(zhí)行
2.14支持Microsoft Windows
Hadoop 2.x - 它可以部署在Windows上。
Hadoop 3.x - 它也支持Windows。
2.15插槽/容器
Hadoop 2.x - Hadoop 1適用于插槽的概念,但Hadoop 2.X適用于容器的概念。通過容器,我們可以運行通用任務(wù)。
Hadoop 3.x - 它也適用于容器的概念。
2.16單點故障
Hadoop 2.x - 具有SPOF的功能,因此只要Namenode失敗,它就會自動恢復(fù)。
Hadoop 3.x - 具有SPOF的功能,因此只要Namenode失敗,它就會自動恢復(fù),無需人工干預(yù)就可以克服它。
2.17HDFS聯(lián)盟
Hadoop 2.x - 在Hadoop 1.0中,只有一個NameNode來管理所有Namespace,但在Hadoop 2.0中,多個NameNode用于多個Namespace。
Hadoop 3.x - Hadoop 3.x還有多個名稱空間用于多個名稱空間。
2.18可擴展性
Hadoop 2.x - 我們可以擴展到每個群集10,000個節(jié)點。
Hadoop 3.x - 更好的可擴展性。 我們可以為每個群集擴展超過10,000個節(jié)點。
2.19更快地訪問數(shù)據(jù)
Hadoop 2.x - 由于數(shù)據(jù)節(jié)點緩存,我們可以快速訪問數(shù)據(jù)。
Hadoop 3.x - 這里也通過Datanode緩存我們可以快速訪問數(shù)據(jù)。
2.20HDFS快照
Hadoop 2.x - Hadoop 2增加了對快照的支持。 它為用戶錯誤提供災(zāi)難恢復(fù)和保護。
Hadoop 3.x - Hadoop 2也支持快照功能。
2.21平臺
Hadoop 2.x - 可以作為各種數(shù)據(jù)分析的平臺,可以運行事件處理,流媒體和實時操作。
Hadoop 3.x - 這里也可以在YARN的頂部運行事件處理,流媒體和實時操作。
2.22群集資源管理
Hadoop 2.x - 對于群集資源管理,它使用YARN。 它提高了可擴展性,高可用性,多租戶。
Hadoop 3.x - 對于集群,資源管理使用具有所有功能的YARN。
hadoop3.X比hadoop2.x的改進
Common主要改進:
Shell script rewrite
過時API刪除
HDFS改進:
支持erasure編碼
支持超過兩個namenode
數(shù)據(jù)均衡
多個服務(wù)端口發(fā)生變化
Yarn改進:
YARN Timeline Service v.2
Support for Opportunistic Containers and Distributed Scheduling
MapRduece改進:
MapReduce task-level native optimization
Reworked daemon and task heap management
其他新特性:
Shared client jars
感謝你能夠認真閱讀完這篇文章,希望小編分享的“Hadoop2和Hadoop3有什么區(qū)別”這篇文章對大家有幫助,同時也希望大家多多支持億速云,關(guān)注億速云行業(yè)資訊頻道,更多相關(guān)知識等著你來學(xué)習(xí)!
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。