搭建Hadoop集群需要以下步驟:
安裝Java:在所有節(jié)點(diǎn)上安裝Java,并設(shè)置正確的JAVA_HOME環(huán)境變量。
下載Hadoop:從Apache官網(wǎng)下載Hadoop的二進(jìn)制包,解壓到所有節(jié)點(diǎn)的相同目錄下。
配置Hadoop:進(jìn)入Hadoop的安裝目錄,編輯etc/hadoop/core-site.xml
文件,添加如下配置:
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://namenode_hostname:9000</value> <!-- namenode_hostname為主節(jié)點(diǎn)的主機(jī)名 -->
</property>
</configuration>
然后編輯etc/hadoop/hdfs-site.xml
文件,添加如下配置:
<configuration>
<property>
<name>dfs.replication</name>
<value>3</value> <!-- 設(shè)置副本數(shù)量 -->
</property>
<property>
<name>dfs.namenode.name.dir</name>
<value>/data/hadoop/dfs/name</value> <!-- 設(shè)置主節(jié)點(diǎn)的數(shù)據(jù)存儲(chǔ)路徑 -->
</property>
<property>
<name>dfs.datanode.data.dir</name>
<value>/data/hadoop/dfs/data</value> <!-- 設(shè)置從節(jié)點(diǎn)的數(shù)據(jù)存儲(chǔ)路徑 -->
</property>
</configuration>
最后編輯etc/hadoop/mapred-site.xml.template
文件,將其另存為etc/hadoop/mapred-site.xml
,添加如下配置:
<configuration>
<property>
<name>mapreduce.framework.name</name>
<value>yarn</value>
</property>
</configuration>
配置主從節(jié)點(diǎn):在etc/hadoop/slaves
文件中按行填寫(xiě)從節(jié)點(diǎn)的主機(jī)名或IP地址,每行一個(gè)節(jié)點(diǎn)。
配置SSH免密碼登錄:在主節(jié)點(diǎn)上生成SSH密鑰對(duì),并將公鑰分發(fā)到所有節(jié)點(diǎn)上,可以使用ssh-keygen
和ssh-copy-id
命令實(shí)現(xiàn)。
啟動(dòng)Hadoop集群:在主節(jié)點(diǎn)上執(zhí)行以下命令啟動(dòng)Hadoop集群。
sbin/start-dfs.sh
sbin/start-yarn.sh
http://namenode_hostname:50070
,YARN界面地址為http://namenode_hostname:8088
。以上是一個(gè)基本的Hadoop集群搭建過(guò)程,具體的配置和調(diào)整可以根據(jù)需求進(jìn)行修改。