溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

CDH 離線(xiàn)安裝部署

發(fā)布時(shí)間:2020-07-28 10:18:10 來(lái)源:網(wǎng)絡(luò) 閱讀:3743 作者:zenge_blog 欄目:大數(shù)據(jù)

CDH相關(guān)介紹: 

參考鏈接:

 https://blog.csdn.net/u013061459/article/details/73368929

https://www.cnblogs.com/raphael5200/p/5293960.html


為了構(gòu)建一個(gè)以數(shù)據(jù)為驅(qū)動(dòng)的業(yè)務(wù)場(chǎng)景,我們需要一個(gè)強(qiáng)大的管理工具去統(tǒng)一并安全地管理我們的業(yè)務(wù)數(shù)據(jù),Cloudera做為一個(gè)強(qiáng)大的數(shù)據(jù)中心管理工具為此孕育而生。Cloudera不光提供了自己衍化重新封裝的市場(chǎng)領(lǐng)先并100%開(kāi)源的商業(yè)化Apache Hadoop發(fā)行版本(CDH, Cloudera’s Distribution including Apache Hadoop)和相關(guān)的組件,其中包括了各類(lèi)安全高效的企業(yè)級(jí)數(shù)據(jù)管理工具,如Hive, HBase,Oozie, Zookeeper等。 Hadoop是Apache(開(kāi)源web服務(wù)器軟件基金會(huì))下的大數(shù)據(jù)開(kāi)源項(xiàng)目,許多商業(yè)公司會(huì)在Apache Hadoop的基礎(chǔ)上重新開(kāi)發(fā)成商業(yè)版本,Cloudera公司就是其中之一,最近在維護(hù)的兩個(gè)Hadoop版本分別是CDH4和CDH5。Hadoop使用分布式的思想存儲(chǔ),計(jì)算和分析數(shù)據(jù),它允許多個(gè)數(shù)據(jù)分析計(jì)算任務(wù)同時(shí)作用在同一個(gè)數(shù)據(jù)塊上并在集群上進(jìn)行分布式計(jì)算,以此來(lái)進(jìn)行超大規(guī)模數(shù)據(jù)的處理。Hadoop是大數(shù)據(jù)處理框架的鼻祖之一,同時(shí)Cloudera公司的Hadoop版本CDH也是目前使用最廣泛的Hadoop商業(yè)版本。從廣泛意義來(lái)說(shuō),CDH是Cloudera發(fā)布的一個(gè)自己封裝的商業(yè)版軟件發(fā)行包,里面不僅包含了Cloudera的商業(yè)版Hadoop,同時(shí)CDH中也包含了各類(lèi)常用的開(kāi)源數(shù)據(jù)處理存儲(chǔ)框架,如Spark,Hive,HBase等。

Cloudera作為一個(gè)強(qiáng)大的商業(yè)版數(shù)據(jù)中心管理工具,提供了各種能夠快速穩(wěn)定運(yùn)行的數(shù)據(jù)計(jì)算框架,如Apache Spark;使用Apache Impala做為對(duì)HDFS,HBase的高性能SQL查詢(xún)引擎;也帶了Hive數(shù)據(jù)倉(cāng)庫(kù)工具幫助用戶(hù)分析數(shù)據(jù); 用戶(hù)也能用Cloudera管理安裝HBase分布式列式NoSQL數(shù)據(jù)庫(kù);Cloudera還包含了原生的Hadoop搜索引擎以及Cloudera Navigator Optimizer去對(duì)Hadoop上的計(jì)算任務(wù)進(jìn)行一個(gè)可視化的協(xié)調(diào)優(yōu)化,提高運(yùn)行效率;同時(shí)Cloudera中提供的各種組件能讓用戶(hù)在一個(gè)可視化的UI界面中方便地管理,配置和監(jiān)控Hadoop以及其它所有相關(guān)組件,并有一定的容錯(cuò)容災(zāi)處理;Cloudera作為一個(gè)廣泛使用的商業(yè)版數(shù)據(jù)中心管理工具更是對(duì)數(shù)據(jù)的安全決不妥協(xié)!


CDH能解決哪些問(wèn)題?

  •   ? 1000臺(tái)服務(wù)器的集群,最少要花費(fèi)多長(zhǎng)時(shí)間來(lái)搭建好Hadoop集群,包括Hive、Hbase、Flume、Kafka、Spark等等

  •   ? 只給你一天時(shí)間,完成以上工作?

  •   ? 對(duì)于以上集群進(jìn)行hadoop版本升級(jí),你會(huì)選擇什么升級(jí)方案,最少要花費(fèi)多長(zhǎng)時(shí)間?

  •   ? 新版本的Hadoop,與Hive、Hbase、Flume、Kafka、Spark等等兼容?



CDH安裝環(huán)境:

https://www.cloudera.com/documentation/enterprise/release-notes/topics/rn_consolidated_pcm.html#concept_ap1_q2g_4cb


CDH安裝

CDH安裝分兩部分,Cloudera Manager(CM)安裝和CDH的安裝。CM包含server端和agent端,通常先安裝CM,在通過(guò)WEB UI的管理控制臺(tái)安裝部署CDH。

對(duì)于CDH的安裝官方提供了三種安裝方式:

1、在線(xiàn)安裝 :https://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_non_production.html

2、rpm/yum 安裝 : https://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_install_path_b.html

3、tar包安裝:https://www.cloudera.com/documentation/enterprise/latest/topics/cm_ig_install_path_c.html


CDH離線(xiàn)安裝過(guò)程:這里以tar包的方式安裝


環(huán)境:

系統(tǒng):CentOS7.2 

JDK版本:1.8

CDH版本:5.14.0


角色:

hadoop01:主節(jié)點(diǎn),需要安裝CM-Server,MySQL

hadoop02:客戶(hù)端,安裝CM-Client

hadoop03:客戶(hù)端,安裝CM-Client


安裝步驟:

1、下載CM安裝包和CDH安裝包:

http://archive.cloudera.com/cm5/cm/5/

下載:

cloudera-manager-centos7-cm5.14.0_x86_64.tar.gz


https://archive.cloudera.com/cdh6/parcels/5.10.0/

下載:

  • CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel 

  • CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.sha1

  • manifest.json


2、所有節(jié)點(diǎn)安裝JDK1.8,并設(shè)置JAVA_HOME 環(huán)境變量,過(guò)程省略


3、所有節(jié)點(diǎn)時(shí)間同步


4、所有節(jié)點(diǎn)修改主機(jī)名,例如hadoop01 這樣修改

vim /etc/sysconfig/network

NETWORKING=yes
HOSTNAME=hadoop01


5、所有修改/etc/hosts文件,并關(guān)閉防火墻和SELinux

192.168.131.165 hadoop01
192.168.131.166 hadoop02
192.168.131.168 hadoop03


6、創(chuàng)建hadoop用戶(hù),生成秘鑰對(duì),使用所有節(jié)點(diǎn)之間能夠面密碼登錄

生產(chǎn)環(huán)境有時(shí)候不允許root賬戶(hù)登錄,所以最好是創(chuàng)建一個(gè)專(zhuān)門(mén)的賬戶(hù)用來(lái)節(jié)點(diǎn)直接互相連接,并且該用戶(hù)要有sudo權(quán)限

adduser hadoop
passwd hadoop



ssh-copy-id -i .ssh/id_rsa.pub HADOOP01
ssh-copy-id -i .ssh/id_rsa.pub HADOOP02
ssh-copy-id -i .ssh/id_rsa.pub HADOOP03

執(zhí)行上面命令后,每個(gè)節(jié)點(diǎn)的hadoop用戶(hù)下會(huì)創(chuàng)建.ssh目錄,并生成authorized_keys文件


#將秘鑰對(duì)拷貝到從節(jié)點(diǎn)

scp id_rsa id_rsa.pub  HADOOP02:~/.ssh
scp id_rsa id_rsa.pub  HADOOP03:~/.ssh


保證每個(gè)節(jié)點(diǎn)的hadoop家目錄下的.ssh目錄下,都有以下幾個(gè)文件

# ll /home/hadoop/.ssh/
總用量 16
-rw------- 1 hadoop hadoop  397 5月  18 10:57 authorized_keys
-rw------- 1 hadoop hadoop 1675 5月  18 10:53 id_rsa
-rw-r--r-- 1 hadoop hadoop  397 5月  18 10:53 id_rsa.pub
-rw-r--r-- 1 hadoop hadoop 1206 5月  18 10:59 known_hosts


#hadoop用戶(hù)添加sudo權(quán)限

邊界/etc/sudoers

追加一行

hadoop ALL=(root)NOPASSWD:ALL


#hadoop用戶(hù)下,執(zhí)行sudo su - root切換到root用戶(hù),能過(guò)沒(méi)有提示輸入密碼則表示正常



7、所有節(jié)點(diǎn)將cloudera-manager的tar包解壓縮到/opt目錄

tar zxf cloudera-manager-el6-cm5.10.0_x86_64.tar.gz -C /opt


8、所有節(jié)點(diǎn)創(chuàng)建用戶(hù)

sudo useradd --system --home=/opt/cm-5.14.0/run/cloudera-scm-server --no-create-home --shell=/bin/false --comment "Cloudera SCM User" cloudera-scm

##下面這一步網(wǎng)上看到的,但不清楚有什么用,好像是使用單用戶(hù)模式用的到,我在后面的CM-Server控制臺(tái)中沒(méi)有啟用單用戶(hù)模式
echo USER=\"cloudera-scm\" >> /etc/default/cloudera-scm-agent



9、所有節(jié)點(diǎn)修改cloudera-scm-agent 配置,將server_host設(shè)置為主節(jié)點(diǎn)的主機(jī)名

cd /opt/cloudera-manager/cm-5.14.0/etc/cloudera-scm-agent
vim  config.ini

設(shè)置server_host=hadoop01 (注意,所有節(jié)點(diǎn)都要改)


所有節(jié)點(diǎn)設(shè)置/proc/sys/vm/swappiness 設(shè)置為最大值 0。當(dāng)前設(shè)置為 60,

echo 0 > /proc/sys/vm/swappiness

上面只是臨時(shí)的修改,重啟后失效,下面是永久修改

編輯/etc/sysctl.conf文件

設(shè)置vm.swappiness=0,并重啟服務(wù)器


所有主機(jī)禁用透明壓縮,參考

https://www.linuxidc.com/Linux/2016-11/137515.htm


echo never > /sys/kernel/mm/transparent_hugepage/defrag
echo never > /sys/kernel/mm/transparent_hugepage/enabled


上面只是臨時(shí)修改,如果要永久修改,則編輯/etc/rc.d/rc.local,追加以下內(nèi)容

if test -f /sys/kernel/mm/transparent_hugepage/enabled; then
    echo never > /sys/kernel/mm/transparent_hugepage/enabled
fi

if test -f /sys/kernel/mm/transparent_hugepage/defrag; then
    echo never > /sys/kernel/mm/transparent_hugepage/defrag
fi


保存退出,然后賦予rc.local文件執(zhí)行權(quán)限:

[root@localhost ~]# chmod +x /etc/rc.d/rc.local

最后重啟系統(tǒng),以后再檢查T(mén)HP應(yīng)該就是被禁用了




10、主節(jié)點(diǎn)配置

a、安裝依賴(lài)包

yum -y install bind-utils chkconfig cyrus-sasl-gssapi cyrus-sasl-plain fuse fuse-libs gcc httpd
yum -y install libxslt mod_ssl openssl openssl-devel perl portmap psmisc  sqlite swig zlib


b、安裝mysql并啟動(dòng)服務(wù)


c、設(shè)置mysql賬戶(hù)的登錄密碼

mysqladmin -u root password '123456'


##創(chuàng)建安裝CDH組件時(shí)需要的庫(kù)

mysql> create database hive DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
Query OK, 1 row affected (0.00 sec)
mysql> create database amon DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
Query OK, 1 row affected (0.00 sec)
mysql> create database oozie DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
Query OK, 1 row affected (0.00 sec)
mysql> create database hue DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
Query OK, 1 row affected (0.00 sec)
mysql> create database reports DEFAULT CHARSET utf8 COLLATE utf8_general_ci;
Query OK, 1 row affected (0.00 sec)

#設(shè)置root授權(quán)訪問(wèn)以上所有的數(shù)據(jù)庫(kù):

#授權(quán)root用戶(hù)在主節(jié)點(diǎn)擁有所有數(shù)據(jù)庫(kù)的訪問(wèn)權(quán)限

grant all privileges on *.* to 'root'@'%' identified by '123456' with grant option;
flush privileges;


d、下載 mysql 驅(qū)動(dòng)包

cd /opt/cloudera-manager/cm-5.10.0/share/cmf/lib
wget http://maven.aliyun.com/nexus/service/local/repositories/hongkong-nexus/content/Mysql/mysql-connector-java/5.1.38/mysql-connector-java-5.1.38.jar


e、創(chuàng)建庫(kù)

為CM創(chuàng)建數(shù)據(jù)庫(kù)

格式:

scm_prepare_database.sh mysql cm -h <hostName> -u<username>  -p<password> --scm-host <hostName>  scm scm scm

對(duì)應(yīng)于:數(shù)據(jù)庫(kù)類(lèi)型  數(shù)據(jù)庫(kù) 服務(wù)器 用戶(hù)名 密碼  –scm-host  Cloudera_Manager_Server 所在節(jié)點(diǎn)……


 cd /opt/cm-5.14.0/share/cmf/schema
 ./scm_prepare_database.sh mysql cm -hlocalhost -uroot -p123456 --scm-host localhost scm scm scm

  JAVA_HOME=/usr/java/jdk1.8.0_151
Verifying that we can write to /opt/cloudera-manager/cm-5.10.0/etc/cloudera-scm-server
Creating SCM configuration file in /opt/cloudera-manager/cm-5.10.0/etc/cloudera-scm-server
Executing:  /usr/java/jdk1.8.0_151/bin/java -cp /usr/share/java/mysql-connector-java.jar:/usr/share/java/oracle-connector-java.jar:/opt/cloudera-manager/cm-5.10.0/share/cmf/schema/../lib/* com.cloudera.enterprise.dbutil.DbCommandExecutor /opt/cloudera-manager/cm-5.10.0/etc/cloudera-scm-server/db.properties com.cloudera.cmf.db.
[                          main] DbCommandExecutor              INFO  Successfully connected to database.
All done, your SCM database is configured correctly!

出現(xiàn)上面的提示表示成功,經(jīng)測(cè)試將locaohost換成hadoop01會(huì)報(bào)錯(cuò),提示沒(méi)有權(quán)限,好像用localhost也沒(méi)有什么問(wèn)題。


f、主節(jié)點(diǎn)上創(chuàng)建/opt/cloudera/parcel-repo目錄

mkdir -p /opt/cloudera/parcel-repo

將下面三個(gè)文件拷貝到該目錄

  • CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel

  • manifest.json

  • CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.sha

注意:將CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.sha1重命名為CDH-5.14.2-1.cdh6.14.2.p0.3-el7.parcel.sha


修改/opt/cloudera/parcel-repo 文件權(quán)限

chown cloudera-scm:cloudera-scm /opt/cloudera


g、創(chuàng)建日志目錄

sudo mkdir -p /var/log/cloudera-scm-headlamp
sudo chown cloudera-scm:cloudera-scm /var/log/cloudera-scm-headlamp
sudo mkdir -p /var/log/cloudera-scm-firehose
sudo chown cloudera-scm:cloudera-scm /var/log/cloudera-scm-firehose
sudo mkdir -p /var/log/cloudera-scm-alertpublisher
sudo chown cloudera-scm:cloudera-scm /var/log/cloudera-scm-alertpublisher
sudo mkdir -p /var/log/cloudera-scm-eventserver
sudo chown cloudera-scm:cloudera-scm /var/log/cloudera-scm-eventserver
sudo mkdir -p /var/lib/cloudera-scm-headlamp
sudo chown cloudera-scm:cloudera-scm /var/lib/cloudera-scm-headlamp
sudo mkdir -p /var/lib/cloudera-scm-firehose
sudo chown cloudera-scm:cloudera-scm /var/lib/cloudera-scm-firehose
sudo mkdir -p /var/lib/cloudera-scm-alertpublisher
sudo chown cloudera-scm:cloudera-scm /var/lib/cloudera-scm-alertpublisher
sudo mkdir -p /var/lib/cloudera-scm-eventserver
sudo chown cloudera-scm:cloudera-scm /var/lib/cloudera-scm-eventserver
sudo mkdir -p /var/lib/cloudera-scm-server
sudo chown cloudera-scm:cloudera-scm /var/lib/cloudera-scm-server



h、在主節(jié)點(diǎn)上啟動(dòng)CM-Manager服務(wù)和CM-Agent服務(wù),并在所有從節(jié)點(diǎn)上啟動(dòng)CM-Agent服務(wù)


/opt/cloudera-manager/cm-5.10.0/etc/init.d/cloudera-scm-server  start
/opt/cloudera-manager/cm-5.10.0/etc/init.d/cloudera-scm-agent  start


11、CM控制臺(tái)配置

登錄http://hadoop01:7180

賬號(hào)密碼都是admin


CDH 離線(xiàn)安裝部署


CDH 離線(xiàn)安裝部署

CDH 離線(xiàn)安裝部署

CDH 離線(xiàn)安裝部署


CDH 離線(xiàn)安裝部署




配置集群的管理賬戶(hù),這個(gè)賬戶(hù)是前面第6步創(chuàng)建的,要求有sudo權(quán)限

CDH 離線(xiàn)安裝部署

我這里集群中只安裝了HDFS和zookeeper服務(wù),如果還需要安裝其他服務(wù),可以在集群中添加

CDH 離線(xiàn)安裝部署





















向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI