溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

Hadoop應(yīng)用之如何實(shí)現(xiàn)Hadoop安裝

發(fā)布時(shí)間:2021-11-26 11:39:02 來源:億速云 閱讀:153 作者:小新 欄目:開發(fā)技術(shù)

這篇文章給大家分享的是有關(guān)Hadoop應(yīng)用之如何實(shí)現(xiàn)Hadoop安裝的內(nèi)容。小編覺得挺實(shí)用的,因此分享給大家做個(gè)參考,一起跟隨小編過來看看吧。

一,安裝hadoop系統(tǒng)

1,添加用戶(所有namenode和datanode需要使用相同的用戶名,所有的信息傳輸需要用戶認(rèn)證)
freebsd7test1#adduser
Username:rhinuxdoop
Fullname:
Uid(Leaveemptyfordefault):
Logingroup[rhinuxdoop]:
Logingroupisrhinuxdoop.Inviterhinuxdoopintoothergroups?[]:
Loginclass[default]:
Shell(shcshtcshbashrbashnologin)[sh]:bash//注意***使用bash,其實(shí)程序運(yùn)行的時(shí)候會(huì)自動(dòng)指定shell環(huán)境
Homedirectory[/home/rhinuxdoop]:/services/rhinuxdoop
客戶端必須是和服務(wù)端同樣的用戶名

2,hadoop需要使用rsync+ssh同步狀態(tài)和數(shù)據(jù),需要無需輸入密碼就可訪問,所以設(shè)置用密鑰認(rèn)證
a,生產(chǎn)密鑰對(duì)(用添加的用戶操作本例用戶為rhinuxdoop)
[rhinuxdoop@freebsd7test1~]$ssh-keygen-tdsa-P''-f~/.ssh/id_dsa
默認(rèn)在~/.ssh/下
b,在本機(jī)用戶中添加
[rhinuxdoop@freebsd7test1~]$cat~/.ssh/id_dsa.pub>>~/.ssh/authorized_keys
c,添加到其他datanode
將namenoderhinuxdoop用戶目錄下.ssh/id_rsa.pub文件內(nèi)容導(dǎo)入其他datanode
[rhinuxdoop@freebsd7test2~]$catid_dsa.pub>>~/.ssh/authorized_keys
d,測(cè)試:用rhinuxdoop在namenode上登陸讓后ssh到所有的datanode(本例中包括自己機(jī)器)
應(yīng)該無需密碼就可以登陸

3,下載hadoop安裝軟件
a,去http://hadoop.apache.org/core/下載***版本hadoop目前為0.16.0版
b,解壓hadoop-0.16.0.tar.gz到用戶目錄/services/rhinuxdoop/
[rhinuxdoop@freebsd7test1~]$tarzxvfhadoop-0.16.0.tar.gz.

4,hadoop-0.16.0目錄結(jié)構(gòu)說明:
a,bin存放腳本程序,
比如主控制程序hadoop,
啟動(dòng)腳本start-all.sh--啟動(dòng)所有hadoop進(jìn)程start-dfs.sh--啟動(dòng)DFS進(jìn)程start-mapred.sh啟動(dòng)MAP/Reduce進(jìn)程
停止腳本stop-all.shstop-dfs.shstop-mapred.sh
b,conf配置文件目錄,
環(huán)境配置文件hadoop-env.sh可以配置環(huán)境變量,比如JAVA_HOME已經(jīng)系統(tǒng)默認(rèn)等。
默認(rèn)配置文件hadoop-default.xml此文件不能修改需要設(shè)置參數(shù)請(qǐng)修改hadoop-site.xml
自定義配置文件hadoop-site.xml此文件可以自定義配置,出現(xiàn)在該文件中的配置項(xiàng),系統(tǒng)將自動(dòng)取代默認(rèn)配置文件hadoop-default.xml中的配置項(xiàng)
namenode指定文件masters此文件來指定master(namenode)機(jī)器名
datanode指定文件slaves此文件來指定slave(datanode)機(jī)器列表,每臺(tái)機(jī)器名占一行
c,log目錄
默認(rèn)日志存放目錄
d,各配置文件具體參數(shù)說明和研究下一個(gè)版本中給出。下面我們看一下Hadoop安裝過程中hadoop配置(freebsd7test1)。

5,hadoop配置(freebsd7test1):
a,建立namenode存儲(chǔ)目錄及數(shù)據(jù)目錄
[rhinuxdoop@freebsd7test1~]$mkdir-p/services/rhinuxdoop/hadoop-0.16.0/filesystem/name
[rhinuxdoop@freebsd7test1~]$mkdir-p/services/rhinuxdoop/hadoop-0.16.0/filesystem/data
b,配置環(huán)境變量,編輯./conf/hadoop-env.sh
===============hadoop-env.sh====================
exportJAVA_HOME=/usr/local/jdk1.5.0
#至少要設(shè)置JAVA_HOME,另外也可以設(shè)置HADOOP_HOME-系統(tǒng)目錄,HADOOP_HOME默認(rèn)為bin目錄的父目錄
=================================================

c,配置hadoop-site.xml(關(guān)于可配置項(xiàng)已經(jīng)各配置項(xiàng)的說明可以參考hadoop-default.xml)
配置項(xiàng)格式為:

<property> <name>io.file.buffer.size</name> <value>4096</value> <description>Thesizeofbufferforuseinsequencefiles.  Thesizeofthisbuffershouldprobablybeamultipleofhardware  pagesize(4096onIntelx86),anditdetermineshowmuchdatais  bufferedduringreadandwriteoperations.</description> </property>  <property> <name>配置項(xiàng)名字</name> <value>配置項(xiàng)的值</value> <description>配置項(xiàng)的說明此文字只是幫助人理解用.</description> </property>

格式化namenode
[rhinuxdoop@freebsd7test1~]$hadoop-0.16.0/bin/hadoopnamenode-format
無報(bào)錯(cuò)既可,Hadoop安裝過程中freebsd7test1基本配置已完成

6,hadoop配置(freebsd7test2及其他datanode)

a,其他datanode必須保持namenode相同的目錄結(jié)構(gòu)所以把namenode目錄復(fù)制過去
[rhinuxdoop@freebsd7test1~]$scp-rhadoop-0.16.0172.16.27.82:/services/rhinuxdoop/

7,啟動(dòng)hadoop
[rhinuxdoop@freebsd7test1~]$hadoop-0.16.0/bin/start-all.sh
此時(shí)會(huì)告知日志記錄的目錄和文件名,日志記錄基本可以在hadoop-site.xml中設(shè)定默認(rèn)在hadoop-default.xml中設(shè)置為info

8,查看和測(cè)試。

a,系統(tǒng)開啟9000和9001端口分別為dfs的namenode和mapreduce的jobtracke監(jiān)聽口。

b,查看datanode狀態(tài):[rhinuxdoop@freebsd7test1~]$hadoop-0.16.0/bin/hadoopdfsadmin-report可以看到各點(diǎn)的狀態(tài)

c,存放文件:[rhinuxdoop@freebsd7test1~]$hadoop-0.16.0/bin/hadoopfs-put/home/xuyunfeng/tzupdater-1.3.3-2007k.ziptzupdater-1.3.3-2007k.zip
將在本地系統(tǒng)目錄的/home/xuyunfeng/tzupdater-1.3.3-2007k.zip存入hadoop文件系統(tǒng)根目錄中。

d,查看hadoop文件系統(tǒng)目錄[rhinuxdoop@freebsd7test1~]$hadoop-0.16.0/bin/hadoopfs-ls
/user/rhinuxdoop/diablo-caffe-freebsd6-i386-1.5.0_07-b01.tar.bz2<r3>543472742008-02-2810:57rw-r--r--rhinuxdoopsupergroup
/user/rhinuxdoop/tzupdater-1.3.3-2007k.zip<r3>2637152008-02-2816:16rw-r--r--rhinuxdoopsupergroup

e,更多hadoop文件系統(tǒng)命令操作請(qǐng)參考手冊(cè)

f,api調(diào)用測(cè)試后續(xù)

g,可以通過web形式去瀏覽NameNode和JobTracker,默認(rèn)端口為:
◆NameNode-http://freebsd7test1.rhinux.com:50070
◆JobTracker-http://freebsd7test1.rhinux.com:50030
◆需要在瀏覽的機(jī)器上配置好hosts。

感謝各位的閱讀!關(guān)于“Hadoop應(yīng)用之如何實(shí)現(xiàn)Hadoop安裝”這篇文章就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,讓大家可以學(xué)到更多知識(shí),如果覺得文章不錯(cuò),可以把它分享出去讓更多的人看到吧!

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI