您好,登錄后才能下訂單哦!
這篇文章主要介紹“Hadoop的聯(lián)邦怎么創(chuàng)建”,在日常操作中,相信很多人在Hadoop的聯(lián)邦怎么創(chuàng)建問題上存在疑惑,小編查閱了各式資料,整理出簡單好用的操作方法,希望對大家解答”Hadoop的聯(lián)邦怎么創(chuàng)建”的疑惑有所幫助!接下來,請跟著小編一起來學習吧!
一、為什么會出現(xiàn)聯(lián)邦?
Hadoop 的 NN 所使用的資源受所在服務(wù)的物理限制,不能滿足實際生產(chǎn)需求。
二、聯(lián)邦的實現(xiàn)
采用多臺 NN 組成聯(lián)邦。NN 是獨立的,NN 之間不需要相互調(diào)用。NN 是聯(lián)合的,同屬于一個聯(lián)邦,所管理的 DN 作為 block 的公共存儲。block pool 的概念,每一個 namespace 都有一個 pool,datanodes 會存儲集群中所有的 pool,block pool 之間的管理是獨立的,一個 namespace 生成一個 blockid 時不需要跟其它 namespace 協(xié)調(diào),一個 namenode 的失敗也不會影響到 datanode對其它 namenodes 的服務(wù)。一個 namespace 和它的 block pool 作為一個管理單元,刪除后,對應(yīng)于datanodes 中的 pool 也會被刪除。集群升級時,這個管理單元也獨立升級。這里引入 clusterID 來標示集群所有節(jié)點。當一個 namenode format 之后,這個 id 生成,集群中其它 namenode 的 format 也用這個 id。
三、主要優(yōu)點:
命名空間可伸縮性——聯(lián)合添加命名空間水平擴展。DN 也隨著 NN 的加入而得到拓展。
性能——文件系統(tǒng)吞吐量不是受單個Namenode 限制。添加更多的Namenode集群擴展文件系統(tǒng)讀/寫吞吐量。
隔離——隔離不同類型的程序,一定程度上控制資源的分配
四、配置:
聯(lián)邦的配置是向后兼容的,允許在不改變?nèi)魏闻渲玫那闆r下讓當前運行的單節(jié)點環(huán)境轉(zhuǎn)換成聯(lián)邦環(huán)境。新的配置方案確保了在集群環(huán)境中的所有節(jié)點的配置文件都是相同的。這里引入了 NameServiceID 概念,作為 namenodes 們的后綴。第一步:配置屬性 dfs.nameservices,用于 datanodes 們識別 namenodes。第二步:為每個 namenode 加入這個后綴。
五、操作:
# 創(chuàng)建聯(lián)邦,不指定 ID 會自動生成
$HADOOP_HOME/bin/hdfs namenode -format [-clusterId <cluster_id>]
# 升級 Hadoop 為集群
$HADOOP_HOME/bin/hdfs start namenode --config $HADOOP_CONF_DIR
-upgrade -clusterId <cluster_ID>
# 擴展已有聯(lián)邦
$HADOOP_HOME/bin/hdfs dfsadmin -refreshNamenodes
<datanode_host_name>:<datanode_rpc_port>
# 退出聯(lián)邦
$HADOOP_HOME/sbin/distribute-exclude.sh <exclude_file>
$HADOOP_HOME/sbin/refresh-namenodes.sh
什么是 CDH 下載地址 : http://archive.cloudera.com/cdh6/cdh/5/ CDH (Cloudera's Distribution, including Apache Hadoop),是 Hadoop眾多分支中的一種,由 Cloudera 維護,基于穩(wěn)定版本的 Apache Hadoop 構(gòu)建,并集成了很多補丁, 可直接用于生產(chǎn)環(huán)境。
CDH 的優(yōu)點: 版本劃分清晰
版本更新速度快
支持 Kerberos 安全認證文檔清晰
支持多種安裝方式(Cloudera Manager、YUM、RPM、Tarball) 什么是 CM Cloudera Manager? 是為了便于在集群中進行 Hadoop
等大數(shù)據(jù)處理相關(guān)的服務(wù)安裝和監(jiān)控管理的組件,對集群中主機、Hadoop、Hive、Spark 等服務(wù)的安裝配置管理做了極大簡化。
Cloudera Manager 有四大功能:
(1)管理:對集群進行管理,如添加、刪除節(jié)點等操作。
(2)監(jiān)控:監(jiān)控集群的健康情況,對設(shè)置的各種指標和系統(tǒng)運行情況進行全面監(jiān)控。
(3)診斷:對集群出現(xiàn)的問題進行診斷,對出現(xiàn)的問題給出建議解決方案。
(4)集成:對 hadoop 的多組件進行整合。
到此,關(guān)于“Hadoop的聯(lián)邦怎么創(chuàng)建”的學習就結(jié)束了,希望能夠解決大家的疑惑。理論與實踐的搭配能更好的幫助大家學習,快去試試吧!若想繼續(xù)學習更多相關(guān)知識,請繼續(xù)關(guān)注億速云網(wǎng)站,小編會繼續(xù)努力為大家?guī)砀鄬嵱玫奈恼拢?/p>
免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。