溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

什么是Hadoop集群動態(tài)擴容

發(fā)布時間:2020-08-04 11:41:16 來源:億速云 閱讀:168 作者:Leah 欄目:編程語言

今天就跟大家聊聊有關(guān)什么是Hadoop集群動態(tài)擴容,可能很多人都不太了解,為了讓大家更加了解,小編給大家總結(jié)了以下內(nèi)容,希望大家根據(jù)這篇文章可以有所收獲。

1、基礎(chǔ)準備

在基礎(chǔ)準備部分,主要是設(shè)置 hadoop 運行的系統(tǒng)環(huán)境

修改新機器系統(tǒng) hostname(通過/etc/sysconfig/network 進行修改)

[root@node-4 ~]# cat /etc/sys conf 1g/network

NE TWORKING=yes

HOS TNAME=node -4

[r oot@node-4 ~ ] #

修改 hosts 文件,將集群所有節(jié)點 hosts 配置進去(集群所有節(jié)點保持hosts文件統(tǒng)一)

rootenode-1 -]# cat /etc/hosts

127.0.0.1   localhost localhost. localdomain localhost4 localhost4. local domain4

: :1        localhost localhost. localdomain localhost6 localhost6. local domain6

192.168.227.151 node-1

192.168.227.152 node-2

192.168.227.153 node-3

192.168.227.154 node-4

rootenode-1 ~]#

設(shè)置 NameNode DataNode 的免密碼登錄(ssh-copy-id 命令實現(xiàn))

修改主節(jié)點 slaves 文件,添加新增節(jié)點的 ip 信息(集群重啟時配合一鍵啟動腳本使用)

[root@node-1 J]# vim /export/servers/hadoop-2 .6. 0-cdh6.14.0/etc/hadoop/s laves

 

node-1

node-2

node-3

node-4

在新的機器上上傳解壓一個新的hadoop安裝包,從主節(jié)點機器上將hadoop的所有配置文件,scp到新的節(jié)點上。

2、添加datanode

namenode所在的機器的/export/servers/hadoop-2.6.0-cdh6.14.0/etc/hadoop 目錄下創(chuàng)建 dfs.hosts 文件

cd /export/servers/hadoop-2.6.0-cdh6.14.0/etc/hadoop

vim dfs.hosts

添加如下主機名稱(包含新服役的節(jié)點)

node-1

node-2

node-3

node-4

namenode 機器的 hdfs-site.xml 配置文件中增加 dfs.hosts 屬性

cd /export/servers/hadoop-2.6.0-cdh6.14.0/etc/hadoop vim hdfs-site.xml

<property>

    <name>dfs.hosts</name>

    <value>/export/servers/hadoop-2.6.0-cdh6.14.0/etc/hadoop/dfs.hosts</value>

</property>

dfs.hosts 屬性的意義:命名一個文件,其中包含允許連接到namenode的主機列表。必須指定文件的完整路徑名。如果該值為空,則允許所有主機。相當于一個白名單,也可以不配置。

在新的機器上單獨啟動datanodehadoop-daemon.sh start datanode

[root@node-4 ~]# hadoop-daemon.sh start datanode

starting datanode: logging to /export /servers/hadoop-2.6.0-cdh614 .0/ lops /hadoop root datanode -node-4 out

[root@node-4 ~]#

刷新頁面就可以看到新的節(jié)點加入進來了

什么是Hadoop集群動態(tài)擴容

3datanode負載均衡服務(wù)

新加入的節(jié)點,沒有數(shù)據(jù)塊的存儲,使得集群整體來看負載還不均衡。因此最后還需要對hdfs負載設(shè)置均衡,因為默認的數(shù)據(jù)傳輸帶寬比較低,可以設(shè)置為64M,即hdfs dfsadmin -setBalancerBandwidth 67108864即可

默認balancerthreshold10%,即各個節(jié)點與集群總的存儲使用率相差不超過10%,我們可將其設(shè)置為5%。然后啟動Balancer,sbin/start-balancer.sh -threshold 5,等待集群自均衡完成即可。

4、添加nodemanager

在新的機器上單獨啟動 nodemanager

yarn-daemon.sh start nodemanager

什么是Hadoop集群動態(tài)擴容

ResourceManager,通過yarn node -list查看集群情況

什么是Hadoop集群動態(tài)擴容

看完上述內(nèi)容,你們對什么是Hadoop集群動態(tài)擴容有進一步的了解嗎?如果還想了解更多知識或者相關(guān)內(nèi)容,請關(guān)注億速云行業(yè)資訊頻道,感謝大家的支持。

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI