溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

hadoop MapReduce初試遇到的問題

發(fā)布時間:2020-07-28 13:58:10 來源:網(wǎng)絡(luò) 閱讀:796 作者:zlfwmm 欄目:大數(shù)據(jù)

hadoop MapReduce初試遇到的問題


./hadoop jar ./MapReduce-jar-with-dependencies.jar com.hc360.mp.WordCountHbaseReader /user/hbase/tabelname01 tablename

在hadoop集群上執(zhí)行 MapReduce任務(wù)時,需要用到許多依賴jar,一般情況下都是在執(zhí)行時,在執(zhí)行命令上進(jìn)行配置指定,這樣會造成執(zhí)行命令太長,并且容易出錯,有時還想帶幾個參數(shù)信息,這樣更容易出錯;

比較好的處理方法是,在生成運(yùn)行jar時,將需要的依賴jar打包到運(yùn)行jar中,這樣在執(zhí)行時所有依賴的jar都有了,就不用指定了。


./hdfs dfs -rmr /user/hbase/

hdfs上已有的文件不能進(jìn)行覆蓋,生成文件時必須是沒有的新文件,可以在產(chǎn)生文件前執(zhí)行以上命令清除已有的文件:


16/07/19 18:26:08 INFO ipc.Client: Retrying connect to server: xxxx/192.168.xx.xx:8032. Already tried 4 time(s); retry policy is etryUpToMaximumCountWithFixedSleep(maxRetries=10, sleepTime=1000 MILLISECONDS)

hadoop集群上,如果沒有啟動 yarn(MapReduce),當(dāng)運(yùn)行MapReduce任務(wù)時,會提示上面的信息; 

當(dāng)執(zhí)行hadoop的shell命令時,如果提示類似上面的信息,可以查看是否啟動了hadoop進(jìn)程。


java.lang.IllegalArgumentException: Does not contain a valid host:port authority:

java.net.UnknownHostException

hadoop集群的hostname配置,主機(jī)名不要包含下劃線“_”,但可以有橫線“-”。

在hadoop集群中每個機(jī)器都要配置集群所有機(jī)器的hostname域名,以便相互訪問。

這里分享一個血的教訓(xùn),在給hostname起名字的時候一定要注意,雖然linux支持一些特殊字符,但java里面并不支持,所以hostname的命名一定要使用數(shù)字和字母(以點(diǎn)號分隔)。如果起的hostname包含了特殊字符下劃線,導(dǎo)致hadoop運(yùn)行時候的reduce階段出錯。


向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI