<samp id="wjtpz"><del id="wjtpz"><kbd id="wjtpz"></kbd></del></samp>

<samp id="wjtpz"><dfn id="wjtpz"></dfn></samp>

溫馨提示×

溫馨提示×

您好，登錄后才能下訂單哦！

密碼登錄×

忘記密碼？

登錄注冊×

獲取短信驗(yàn)證碼

其他方式登錄

點(diǎn)擊登錄注冊即表示同意《億速云用戶服務(wù)條款》

用戶登錄×

賬戶密碼登錄

請使用微信掃描上方二維碼

使用幫助

請求超時(shí)！

請點(diǎn)擊重新獲取二維碼

Hadoop機(jī)架感知

發(fā)布時(shí)間：2020-08-12 19:57:48 來源：網(wǎng)絡(luò) 閱讀：1511 作者：duanpeng198738 欄目：大數(shù)據(jù)

背景

最近在整理以前學(xué)過的大數(shù)據(jù)相關(guān)知識，今天從Hadoop的機(jī)架感知開始，Hadoop機(jī)架感知的實(shí)現(xiàn)有2種方式：
1）、通過實(shí)現(xiàn)一個Java接口DNSToSwitchMapping，然后在core-site.xml配置文件中配置net.topology.node.switch.mapping.impl，其值是實(shí)現(xiàn)DNSToSwitchMapping的類的全路徑，例如：

<property>
             <name>net.topology.node.switch.mapping.impl</name>
             <value>com.inspur.rackawar.test.MyDNSToSwitchMapping</value>
 </property>

2）、大多數(shù)安裝并不需要額外實(shí)現(xiàn)新的接口，只需要使用默認(rèn)的ScriptBasedMapping實(shí)現(xiàn)即可，它運(yùn)行用戶定義的腳本來描述映射關(guān)系。腳本的存放路徑通過core-site.xml文件中的配置項(xiàng)topology.script.file.name控制。只要不是非常復(fù)雜的業(yè)務(wù)，我個人推薦使用第二種方式，靈活簡單。
Hadoop的分布式集群通常包含非常多的服務(wù)器，由于受到機(jī)架槽位和交換機(jī)網(wǎng)口的限制，通常大型的分布式集群都會跨好幾個機(jī)架，由多個機(jī)架上的服務(wù)器共同組成一個分布式集群。機(jī)架內(nèi)的服務(wù)器之間的網(wǎng)絡(luò)速度通常都會高于跨機(jī)架服務(wù)器之間的網(wǎng)絡(luò)速度，并且機(jī)架之間服務(wù)器的網(wǎng)絡(luò)通信通常受到上層交換機(jī)間網(wǎng)絡(luò)帶寬的限制。
具體到Hadoop集群，由于hadoop的HDFS對數(shù)據(jù)文件的分布式存放是按照分塊block存儲，每個block會有多個副本(默認(rèn)為3)，并且為了數(shù)據(jù)的安全和高效，所以hadoop默認(rèn)對3個副本的存放策略為：
第一個block副本放在和client所在的node里（如果client不在集群范圍內(nèi)，則這第一個node是隨機(jī)選取的）。
第二個副本放置在與第一個節(jié)點(diǎn)不同的機(jī)架中的node中（隨機(jī)選擇）。
第三個副本放置在與第一個副本所在節(jié)點(diǎn)同一機(jī)架的另一個節(jié)點(diǎn)上。
如果還有更多的副本就隨機(jī)放在集群的node里。
這樣的策略可以保證對該block所屬文件的訪問能夠優(yōu)先在本rack下找到，如果整個rack發(fā)生了異常，也可以在另外的rack上找到該block的副本。這樣足夠的高效，并且同時(shí)做到了數(shù)據(jù)的容錯。

但是，hadoop對機(jī)架的感知并非是自適應(yīng)的，亦即，hadoop集群分辨某臺slave機(jī)器是屬于哪個rack并非是智能感知的，而是需要hadoop的管理者人為的告知hadoop哪臺機(jī)器屬于哪個rack，這樣在hadoop的namenode啟動初始化時(shí)，會將這些機(jī)器與rack的對應(yīng)信息保存在內(nèi)存中，用來作為對接下來所有的HDFS的寫塊操作分配datanode列表時(shí)（比如3個block對應(yīng)三臺datanode）的選擇datanode策略，做到hadoop allocate block的策略：盡量將三個副本分布到不同的rack。
接下來的問題就是：通過什么方式能夠告知hadoop namenode哪些slaves機(jī)器屬于哪個rack？以下是配置步驟。

配置

默認(rèn)情況下，hadoop的機(jī)架感知是沒有被啟用的。所以，在通常情況下，hadoop集群的HDFS在選機(jī)器的時(shí)候，是隨機(jī)選擇的，也就是說，很有可能在寫數(shù)據(jù)時(shí)，hadoop將第一塊數(shù)據(jù)block1寫到了rack1上，然后隨機(jī)的選擇下將block2寫入到了rack2下，此時(shí)兩個rack之間產(chǎn)生了數(shù)據(jù)傳輸?shù)牧髁?，再接下來，在隨機(jī)的情況下，又將block3重新又寫回了rack1，此時(shí)，兩個rack之間又產(chǎn)生了一次數(shù)據(jù)流量。在job處理的數(shù)據(jù)量非常的大，或者往hadoop推送的數(shù)據(jù)量非常大的時(shí)候，這種情況會造成rack之間的網(wǎng)絡(luò)流量成倍的上升，成為性能的瓶頸，進(jìn)而影響作業(yè)的性能以至于整個集群的服務(wù)。
要將hadoop機(jī)架感知的功能啟用，配置非常簡單，在namenode所在機(jī)器的core-site.xml配置文件中配置一個選項(xiàng)：

<property>
            <name>topology.script.file.name</name>
            <value>/software/hadoop/etc/hadoop/topology.py</value>
</property

這個配置選項(xiàng)的value指定為一個可執(zhí)行程序，通常為一個腳本，該腳本接受一個參數(shù)，輸出一個值。接受的參數(shù)通常為某臺datanode機(jī)器的ip地址，而輸出的值通常為該ip地址對應(yīng)的datanode所在的rack，例如”/dc1/rack1”。Namenode啟動時(shí)，會判斷該配置選項(xiàng)是否為空，如果非空，則表示已經(jīng)用機(jī)架感知的配置，此時(shí)namenode會根據(jù)配置尋找該腳本，并在接收到每一個datanode的heartbeat時(shí)，將該datanode的ip地址作為參數(shù)傳給該腳本運(yùn)行，并將得到的輸出作為該datanode所屬的機(jī)架，保存到內(nèi)存的一個map中。
至于腳本的編寫，就需要將真實(shí)的網(wǎng)絡(luò)拓樸和機(jī)架信息了解清楚后，通過該腳本能夠?qū)C(jī)器的ip地址正確的映射到相應(yīng)的機(jī)架上去。一個簡單的實(shí)現(xiàn)如下：

#!/usr/bin/python
#coding=utf-8
import sys

rack={"192.168.137.201":"/dc1/rack1",
          "192.168.137.202":"/dc1/rack1",
          "192.168.137.203":"/dc1/rack2",
          "192.168.137.204":"/dc1/rack2",
          "s201":"/dc1/rack1",
          "s202":"/dc1/rack1",
         "s203":"/dc1/rack2",
         "s204":"/dc1/rack2"
        }

if __name__=="__main__":
   print rack.get(sys.argv[1],"/default-rack")

由于沒有找到確切的文檔說明到底是主機(jī)名還是ip地址會被傳入到腳本，所以在腳本中最好兼容主機(jī)名和ip地址。

并且要賦予該python文件有執(zhí)行的權(quán)限：chmod u+x topology.py
chmod g+x topology.py

重啟namenode,如果配置成功，namenode啟動日志中會輸出：

2017-12-12 20:47:03,923 INFO org.apache.hadoop.net.NetworkTopology: Adding a new node: /dc1/rack1/192.168.137.201:50010
這個時(shí)候說明Hadoop的機(jī)架感知已被啟用。
查看HADOOP機(jī)架信息命令：

[hadoop@s200 hadoop]$ hdfs dfsadmin -printTopology
Rack: /dc1/rack1
   192.168.137.201:50010 (s201)
   192.168.137.202:50010 (s202)

Rack: /dc1/rack2
   192.168.137.203:50010 (s203)
   192.168.137.204:50010 (s204)

需要注意：
python腳本一定要在Linux服務(wù)器上創(chuàng)建，不然在windows創(chuàng)建之后上傳會出現(xiàn)意想不到的一些錯誤；

向AI問一下細(xì)節(jié)

推薦閱讀：

免責(zé)聲明：本站發(fā)布的內(nèi)容（圖片、視頻和文字）以原創(chuàng)、轉(zhuǎn)載和分享為主，文章觀點(diǎn)不代表本網(wǎng)站立場，如果涉及侵權(quán)請聯(lián)系站長郵箱：is@yisu.com進(jìn)行舉報(bào)，并提供相關(guān)證據(jù)，一經(jīng)查實(shí)，將立刻刪除涉嫌侵權(quán)內(nèi)容。

上一篇新聞：
云計(jì)算教程學(xué)習(xí)入門視頻課件：kubeadm使用ssl證書說明
下一篇新聞：
“飲水機(jī)”形象比喻教你什么是RAID

猜你喜歡

AI
助
手

產(chǎn)品服務(wù)

地區(qū)劃分

專題活動

幫助支持

關(guān)于我們

售后咨詢

7*24小時(shí)在線電話：400-100-2938

7*24小時(shí)在線 QQ：800811969

關(guān)注億速云

億速云公眾號

手機(jī)網(wǎng)站二維碼