溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

Hadoop 2.0中的CDH4 MR如何配置

發(fā)布時間:2021-12-09 15:59:37 來源:億速云 閱讀:106 作者:小新 欄目:大數(shù)據(jù)

這篇文章主要為大家展示了“Hadoop 2.0中的CDH4 MR如何配置”,內(nèi)容簡而易懂,條理清晰,希望能夠幫助大家解決疑惑,下面讓小編帶領大家一起研究并學習一下“Hadoop 2.0中的CDH4 MR如何配置”這篇文章吧。

MR1

cdh不建議使用MRv2.0作為生產(chǎn)環(huán)境,故依舊提供了mr1的包

mr1-2.0.0-mr1-cdh5.1.2.tar.gz

解壓后copy至原h(huán)adoop路徑,有如下文件沖突:

[root@h011171 ~]# cp -r hadoop-2.0.0-cdh5.1.2/* /usr/local/hadoop/ cp: overwrite `/usr/local/hadoop/bin/rcc’? y cp: overwrite `/usr/local/hadoop/bin/hadoop’? y cp: overwrite `/usr/local/hadoop/cloudera/cdh_version.properties’? y cp: overwrite `/usr/local/hadoop/cloudera/apply-patches’? y cp: overwrite `/usr/local/hadoop/cloudera/build.properties’? y cp: overwrite `/usr/local/hadoop/cloudera/CHANGES.cloudera.txt’? y

均覆蓋即可

基本兼容cdh4 mr1的所有mapreduce配置,包括公平調(diào)度器/hadoop acl權(quán)限設置,

使用

./bin/start-mapred.sh ./bin/stop-mapred.sh

監(jiān)控調(diào)度界面同原CDH3

MR2(YARN)

MRv2最基本的設計思想是將JobTracker的兩個主要功能,即資源管理和作業(yè)調(diào)度/監(jiān)控分成兩個獨立的進程。在該解決方案中包含兩個組件:全局的ResourceManager(RM)和與每個應用相關的ApplicationMaster(AM)。這里的“應用”指一個單獨的MapReduce作業(yè)或者DAG作業(yè)。RM和與NodeManager(NM,每個節(jié)點一個)共同組成整個數(shù)據(jù)計算框架。RM是系統(tǒng)中將資源分配給各個應用的最終決策者。AM實際上是一個具體的框架庫,它的任務是【與RM協(xié)商獲取應用所需資源】和【與NM合作,以完成執(zhí)行和監(jiān)控task的任務】。

架構(gòu)描述如下:

Hadoop 2.0中的CDH4 MR如何配置

Hadoop 2.0中的CDH4 MR如何配置

配置

mapred-site.xml配置

<!&ndash; YARN &ndash;>   <property> <name>mapreduce.framework.name</name> <value>yarn</value> </property> <property> <name>mapreduce.jobhistory.address</name> <value>h011200.hebe.grid.sina.com.cn:10020</value> </property> <property> <name>mapreduce.jobhistory.webapp.address</name> <value>h011200.hebe.grid.sina.com.cn:19888</value> </property>

yarn-site.xml配置

<property> <name>yarn.resourcemanager.resource-tracker.address</name> <value>h011200.hebe.grid.sina.com.cn:8031</value> </property> <property> <name>yarn.resourcemanager.address</name>                # RMtracker地址意同jobtrakcer <value>h011200.hebe.grid.sina.com.cn:8032</value> </property> <property> <name>yarn.resourcemanager.scheduler.address</name>     # RMscheduler地址意同mv1的jobscheduler <value>h011200.hebe.grid.sina.com.cn:8030</value> </property> <property> <name>yarn.resourcemanager.admin.address</name> <value>h011200.hebe.grid.sina.com.cn:8033</value> </property> <property> <name>yarn.resourcemanager.webapp.address</name>  #RM Web地址同mr1 默認的50030 <value>h011200.hebe.grid.sina.com.cn:8088</value> </property>    <property>  <description>Classpath for typical applications.</description> <name>yarn.application.classpath</name> <value> $HADOOP_CONF_DIR, $HADOOP_COMMON_HOME/*,$HADOOP_COMMON_HOME/lib/*, $HADOOP_HDFS_HOME/*,$HADOOP_HDFS_HOME/lib/*, $HADOOP_MAPRED_HOME/*,$HADOOP_MAPRED_HOME/lib/*, $YARN_HOME/*,$YARN_HOME/lib/* </value> </property> <property> <name>yarn.nodemanager.aux-services</name> <value>mapreduce.shuffle</value> </property> <property> <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name> <value>org.apache.hadoop.mapred.ShuffleHandler</value> </property> <property> <name>yarn.nodemanager.local-dirs</name> <value>/data1/hadoop/data/yarn/local</value> </property> <property> <name>yarn.nodemanager.log-dirs</name> <value>/data1/hadoop/data/yarn/log</value> </property> <property> <description>Where to aggregate logs</description> <name>yarn.nodemanager.remote-app-log-dir</name> <value>/var/log/hadoop-yarn/apps</value> </property>    <property> <name>yarn.app.mapreduce.am.staging-dir</name> <value>/user</value> </property>

啟動

./sbin/start-yarn.sh

會啟動本地RM及遠程NM

./sbin/mr-jobhistory-daemon.sh start historyserver

啟動本地historyserver

RM界面

Hadoop 2.0中的CDH4 MR如何配置

Job history界面

Hadoop 2.0中的CDH4 MR如何配置

以上是“Hadoop 2.0中的CDH4 MR如何配置”這篇文章的所有內(nèi)容,感謝各位的閱讀!相信大家都有了一定的了解,希望分享的內(nèi)容對大家有所幫助,如果還想學習更多知識,歡迎關注億速云行業(yè)資訊頻道!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI