溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析

發(fā)布時(shí)間:2021-12-20 11:54:12 來(lái)源:億速云 閱讀:137 作者:小新 欄目:大數(shù)據(jù)

這篇文章主要介紹大數(shù)據(jù)爬蟲(chóng)安裝的示例分析,文中介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們一定要看完!

爬蟲(chóng)安裝前準(zhǔn)備工作:大數(shù)據(jù)平臺(tái)安裝完成、zookeeper、redis、elasticsearch、mysql等組件安裝啟動(dòng)成功。

1、修改爬蟲(chóng)安裝配置文件(最好在線下修改好后再上傳平臺(tái))

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

2、修改crawler\dkcrw\jdbc.properties配置文件(只修改圖片里的內(nèi)容其他內(nèi)容默認(rèn)即可)

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

Hbase.zookeeper.quorum所填地址應(yīng)在DKM監(jiān)控平臺(tái)查看:

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

Redis相關(guān)配置看如下界面:

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

3、把已修改的crawler\dkcrw\下的jdbc.properties配置文件替換到\crawler\dkcrw-tomcat-7.0.56\webapps\ROOT\WEB-INF\classes下(這下面有一個(gè)沒(méi)有改好的直接替換)

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

修改好后把修改好的爬蟲(chóng)文件打壓成壓縮文件

4、上傳平臺(tái)主節(jié)點(diǎn)并解壓(這里就不介紹怎么上傳了的了,本次例子是上傳到root目錄下,安裝包上傳到任何目錄下都可以推選root目錄)

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

unzip 解壓命令,解壓唱功后會(huì)多了一個(gè)  cuawler  的文件夾

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

使用cd  crawler  命令進(jìn)入  crawler 文件夾下

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

使用mysql -uroot -p123456 < numysql.sql 命令添加numysql.sql數(shù)據(jù)庫(kù)

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

5、分發(fā)爬蟲(chóng)文件

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

每個(gè)節(jié)點(diǎn)都需要有dkcrw文件, dkcrw-tomcat-7.0.56文件只能放在一個(gè)節(jié)點(diǎn)上,不能放在主節(jié)點(diǎn)上(推選放在從節(jié)點(diǎn))

命令:

scp -r  {要分發(fā)的文件名可填寫(xiě)多個(gè),如果不在要分發(fā)文件的目錄下請(qǐng)?zhí)砑勇窂絵  {分發(fā)到的服務(wù)器ip或名稱(chēng):分發(fā)到的路徑}

例如:

cd /opt/dkh

scp -r dkcrw dk2:/opt/dkh/

scp -r dkcrw dkcrw-tomcat-7.0.56/ dk2:/opt/dkh/

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

6、在分發(fā)了dkcrw-tomcat-7.0.56文件的節(jié)點(diǎn)上給文件添加權(quán)限

命令:

chmod -R 755 {需要給權(quán)限的文件等}

例如:

cd /opt/dkh

chmod -R 755 dkcrw dkcrw-tomcat-7.0.56/

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

7、啟動(dòng)爬蟲(chóng)界面

命令:

cd /opt/dkh/dkcrw-tomcat-7.0.56/bin/

./startup.sh

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

啟動(dòng)界面之后再瀏覽器中輸入啟動(dòng)界面節(jié)點(diǎn)的IP,來(lái)打開(kāi)爬蟲(chóng)界面看是否啟動(dòng)成功(賬號(hào)密碼是默認(rèn)的)

大數(shù)據(jù)爬蟲(chóng)安裝的示例分析 

8、啟動(dòng)每個(gè)節(jié)點(diǎn)的dkcrw.jar

命令:

主節(jié)點(diǎn)運(yùn)行

cd /opt/dkh/dkcrw/

nohup java -jar dkcrw.jar master > dkcrw.log 2>&1 &

從節(jié)點(diǎn)運(yùn)行

cd /opt/dkh/dkcrw/

nohup java -jar dkcrw.jar slave > dkcrw.log 2>&1 &

注意:可以先使用前臺(tái)啟動(dòng)爬蟲(chóng),確定爬蟲(chóng)沒(méi)錯(cuò)誤。

前臺(tái)啟動(dòng)命令java -jar dkcrw.jar master/slave

以上是“大數(shù)據(jù)爬蟲(chóng)安裝的示例分析”這篇文章的所有內(nèi)容,感謝各位的閱讀!希望分享的內(nèi)容對(duì)大家有幫助,更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道!

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI