溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

Hadoop 2.4安裝與配置

發(fā)布時間:2020-08-06 03:14:24 來源:網(wǎng)絡(luò) 閱讀:268 作者:liyong0802 欄目:大數(shù)據(jù)

一、hadoop2.4編譯方法可參考:Linux64位操作系統(tǒng)(CentOS6.6)上如何編譯hadoop2.4.0。

二、準(zhǔn)備工具

1.部署準(zhǔn)備兩個機器test1為Master,test2為Slave。

 在兩個機器上分別vim /etc/hosts,加入如下內(nèi)容:  

192.168.1.100 test1  
192.168.1.200 test2

2.增加hadoop用戶

groupadd hadoop  
useradd hadoop -g hadoop  
passwd hadoop

3.設(shè)置Master無密碼登錄slave

 在test1下生成公鑰/私鑰對并復(fù)制到test2上。  

su hadoop  
ssh-keygen -t rsa -P ''  
scp ~/.ssh/id_rsa.pub hadoop@test2:~/.ssh/id_rsa.pub

 test2把從test1復(fù)制的id_rsa.pub添加到.ssh/authorzied_keys文件里  

cat id_rsa.pub >> authorized_keys  
chmod 600 .ssh/authorized_keys

4.修改句柄數(shù):

ulimit -n 65535  
vim /etc/security/limits.conf增加如下內(nèi)容:  
\*    hard    nofile   65535  
\*    soft    nofile   65535

三、配置hadoop

  將編譯好的hadoop2.4.0解壓后修改etc/hadoop目錄里的配置文件。

1.修改hadoop-env.sh

export JAVA_HOME=/opt/jdk

2.修改core-site.xml

<property>  
    <name>fs.default.name</name>  
    <value>hdfs://HDP125:9000</value>  
</property>  
<property>  
    <name>hadoop.tmp.dir</name>  
    <value>/home/${user.name}/tmp</value>  
</property>  
<property>  
    <name>fs.trash.interval</name>  
    <value>1440</value>  
</property>

 說明:

  fs.defaultDFS:設(shè)置NameNode的IP和端口

  hadoop.tmp.dir:設(shè)置Hadoop臨時目錄,(默認(rèn)/tmp,機器重啟會丟失數(shù)據(jù)?。?/span>

  fs.trash.interval:開啟Hadoop回收站 

3.修改hdfs-site.xml

<property>  
    <name>dfs.replication</name>  
    <value>1</value>  
</property>  
<property>  
    <name>dfs.namenode.name.dir</name>  
    <value>/home/${user.name}/dfs_name</value>  
</property>  
<property>  
    <name>dfs.datanode.data.dir</name>  
    <value>/home/${user.name}/dfs_data</value>  
</property>  
<property>  
    <name>dfs.support.append</name>  
    <value>true</value>  
</property>  
<property>  
    <name>dfs.datanode.max.xcievers</name>  
    <value>4096</value>  
</property>

 說明:

  dfs.replication:文件復(fù)本數(shù)

  dfs.namenode.name.dir:設(shè)置NameNode存儲元數(shù)據(jù)(fsp_w_picpath)的本地文件系統(tǒng)位置

  dfs.datanode.data.dir:設(shè)置DataNode存儲數(shù)據(jù)的本地文件系統(tǒng)位置

  dfs.support.append:設(shè)置HDFS是否支持在文件末尾追加數(shù)據(jù)

  dfs.datanode.max.xcievers:設(shè)置datanode可以創(chuàng)建的最大xcievers數(shù)

4.修改yarn-site.xml

<property>  
  <name>yarn.nodemanager.aux-services</name>  
  <value>mapreduce_shuffle</value>  
</property>  
<property>  
  <name>yarn.resourcemanager.hostname</name>  
  <value>master</value>  
</property>  
<property>  
  <name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>  
  <value>org.apache.hadoop.mapred.ShuffleHandler</value>  
</property>  
<property>  
  <name>yarn.timeline-service.hostname</name>  
  <value>master</value>  
</property>

5.修改mapred-site.xml

<property>  
  <name>mapreduce.framework.name</name>  
  <value>yarn</value>  
</property>

6.修改slave

test1  
test2

7.把配置好的Hadoop程序復(fù)制到其它節(jié)點

scp -r /opt/hadoop hadoop@test2:/opt/  
chown -R hadoop:hadoop /opt/hadoop

 

四、啟動和關(guān)閉hadoop

1.第一次使用一個分布式文件系統(tǒng),需要對其進行格式化:

./bin/hadoop namenode –format

2.啟動Hadoop:

sbin/start-all.sh

3.關(guān)閉Hadoop:

sbin/start-all.sh

4.Hadoop自帶的WEB管理界面

   http://test1:50070

向AI問一下細節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關(guān)證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI