溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何對(duì)網(wǎng)絡(luò)管理進(jìn)行部署?

發(fā)布時(shí)間:2020-05-29 17:25:58 來(lái)源:億速云 閱讀:242 作者:鴿子 欄目:云計(jì)算

1、環(huán)境準(zhǔn)備

單機(jī)部署:官方建議硬件要求為 4C/16G 以上

  • 1 臺(tái) 4 核 16G
  • 2 臺(tái) 4 核 8G

1.1:獲取軟件包

訪問(wèn):https://bk.tencent.com/download/

1.2:系統(tǒng)環(huán)境設(shè)置

官方建議:要求 CentOS-7.0 以上版本,推薦 CentOS-7.5

安裝一些常用命令

[root@localhost ~]# yum -y install vim lrzsz net-tools ntp wget

1.2.1:關(guān)閉 seLinux

[root@localhost ~]# setenforce 0
#修改配置文件
[root@localhost ~]# sed -ri 's/SELINUX=enforcing/SELINUX=disabled/' /etc/selinux/config

1.2.2:重啟系統(tǒng)

[root@localhost ~]# reboot

1.2.3:安裝 rsync

# 檢查是否有rsync命令,如果有返回rsync路徑,可以跳過(guò)后面的命令
[root@localhost ~]# which rsync
# 安裝rsync
[root@localhost ~]# yum -y install rsync

1.2.4:關(guān)閉防火墻

# 檢查默認(rèn)防火墻狀態(tài), 如果返回not running,可以跳過(guò)后面的命令
[root@localhost ~]# firewall-cmd --state
#停止并禁用firewalld:
[root@localhost ~]# systemctl stop firewalld     # 停止firewalld
[root@localhost ~]# systemctl disable firewalld  # 禁用firewall開(kāi)機(jī)啟動(dòng)

1.2.5:調(diào)整最大文件打開(kāi)數(shù)

# 檢查當(dāng)前root賬號(hào)下的max open files值
[root@localhost ~]# ulimit -n

#如果為默認(rèn)的1024,建議通過(guò)修改配置文件調(diào)整為102400或更大。
[root@localhost ~]# vim /etc/security/limits.d/99-nofile.conf
 root soft nofile 102400
 root hard nofile 102400
這里使用的單獨(dú)的配置文件覆蓋/etc/security/limits.conf默認(rèn)值的方式,請(qǐng)根據(jù)系統(tǒng)環(huán)境自行調(diào)整。

修改后,重新使用root登錄檢查是否生效
[root@localhost ~]# su
[root@localhost ~]# ulimit -n

1.2.6:時(shí)間同步

服務(wù)器后臺(tái)時(shí)間不同步會(huì)對(duì)時(shí)間敏感的服務(wù)帶來(lái)不可預(yù)見(jiàn)的后果。務(wù)必在安裝和使用藍(lán)鯨時(shí)保證時(shí)間同步。

# 檢查每臺(tái)機(jī)器當(dāng)前時(shí)間和時(shí)區(qū)是否一致,若相互之間差別大于3s(考慮批量執(zhí)行時(shí)的時(shí)差),建議校時(shí)。
[root@localhost ~]# yum -y install ntp
[root@localhost ~]# date -R
# 查看和ntp server的時(shí)間差異(需要外網(wǎng)訪問(wèn),如果內(nèi)網(wǎng)有ntpd服務(wù)器,自行替換域名為該服務(wù)的地址)
[root@localhost ~]# ntpdate -d cn.pool.ntp.org

#如果輸出的最后一行offset大于1s建議校時(shí)
#和ntp服務(wù)器同步時(shí)間
[root@localhost ~]# ntpdate cn.pool.ntp.org

1.2.7:檢查是否存在全局 HTTP 代理

藍(lán)鯨服務(wù)器之間會(huì)有的 http 請(qǐng)求,如果存在 http 代理,且未能正確代理這些請(qǐng)求,會(huì)發(fā)生不可預(yù)見(jiàn)的錯(cuò)誤。

#檢查http_proxy https_proxy變量是否設(shè)置,若為空可以跳過(guò)后面的操作
[root@localhost ~]# echo "$http_proxy" "$https_proxy"

對(duì)于本機(jī)配置http_proxy變量的方式,請(qǐng)依次查找文件/etc/profile、/etc/bashrc、$HOME/.bashrc等是否有設(shè)置。

1.2.8:關(guān)閉 NetworkManager

#查看NetworkManager狀態(tài)
[root@localhost ~]# systemctl status NetworkManager.service

#關(guān)閉NetworkManager  
[root@localhost ~]# systemctl stop NetworkManager.service

#將NetworkManager 服務(wù)設(shè)置開(kāi)機(jī)不啟動(dòng)
[root@localhost ~]# systemctl disable NetworkManager.service  

1.3:配置 YUM 源

1.3.1:獲取 BASE 源

#備份默認(rèn)源
[root@localhost ~]# mv /etc/yum.repos.d/CentOS-Base.repo /etc/yum.repos.d/CentOS-Base.repo.backup

#獲取網(wǎng)絡(luò)源
[root@localhost ~]# wget -O /etc/yum.repos.d/CentOS-Base.repo http://mirrors.cloud.tencent.com/repo/centos7_base.repo

1.3.2:獲取 EPEL 源

[root@localhost ~]# wget -O /etc/yum.repos.d/epel.repo http://mirrors.cloud.tencent.com/repo/epel-7.repo

#更新緩存
[root@localhost ~]# yum clean all
[root@localhost ~]# yum makecache

1.4:獲取證書(shū)

https://bk.tencent.com/download_ssl/

通過(guò)命令得到本機(jī)的 Mac 地址,然后復(fù)制到上面網(wǎng)址中進(jìn)行下載證書(shū)文件

2、安裝前準(zhǔn)備

2.1:解壓程序包

#上傳包至服務(wù)器并解壓程序包到/data目錄下
[root@localhost ~]# mkdir /data
[root@localhost ~]# tar -xf bkce_src-5.0.4.tar.gz -C /data/
#解壓后/data目錄下有2個(gè)目錄install 和 src目錄
#解壓ssl證書(shū)文件
[root@localhost ~]# tar -xf ssl_certificates.tar.gz -C /data/src/cert/

2.2:修改配置文件

2.2.1:install.conf

install.config 是模塊和服務(wù)器對(duì)應(yīng)關(guān)系的配置文件,描述在哪些機(jī)器上安裝哪些模塊。 每行兩列,第一列是 IP 地址;第二列是以英文逗號(hào)分隔的模塊名稱。

[root@localhost ~]# cd /data/install/
[root@localhost install]# cp install.config.3IP.sample install.config
[root@localhost install]# vim install.config
注意:此處云服務(wù)器寫公網(wǎng)ip
[root@localhost install]# curl ip.sb

[root@localhost install]# vim globals.env
下面的域名根據(jù)實(shí)際情況進(jìn)行修改為自己的

export BK_DOMAIN="bk.cloud.tencent.com"                 # 藍(lán)鯨根域名(不含主機(jī)名)
export PAAS_FQDN="yppaas.$BK_DOMAIN"     # PAAS 完整域名
export CMDB_FQDN="ypcmdb.$BK_DOMAIN"     # CMDB 完整域名
export JOB_FQDN="ypjob.$BK_DOMAIN"       # JOB 完整域名
 PAAS_ADMIN_PASS為`BWvQEaYO`修改

其余默認(rèn)即可

2.2.3:pip.conf

[root@localhost ~]# mkdir -p /data/src/.pip/

[root@localhost ~]# vim /data/src/.pip/pip.conf
 [global]
index-url = ![img](file:///C:\Users\LFL\AppData\Local\Temp\%W@GJ$ACOF(TYDYECOKVDYB.png)https://pypi.tuna.tsinghua.edu.cn/simple

[root@localhost ~]# curl -I http://mirrors.cloud.tencent.com/pypi/simple

2.3:配置免密登入

[root@localhost ~]# cd /data/install/
[root@localhost install]# bash configure_ssh_without_pass  # 根據(jù)提示輸入各主機(jī)的 root 密碼完成免密登陸配置

2.4:安裝前檢查環(huán)境

[root@localhost ~]# cd /data/install/
[root@localhost install]# bash precheck.sh
  • 正常如圖下所示

  • 如果發(fā)現(xiàn)有[FAIL]的報(bào)錯(cuò),按照提示和本文檔修復(fù)。修復(fù)后,可繼續(xù)跑 precheck.sh 腳本,直到不再出現(xiàn)[FAIL]。如果需要從頭開(kāi)始檢查,請(qǐng)使用 precheck.sh -r 參數(shù)

3、開(kāi)始安裝

3.1:執(zhí)行安裝

[root@localhost ~]# mkdir /usr/local/blueking
[root@localhost ~]# cd /data/install/
[root@localhost install]# ./install_minibk -y
……
<<check_networkmanager>> has been checked successfully... SKIP
<<check_firewalld>> has been checked successfully... SKIP
where do you want to install blueking products.
enter a absolute path [/data/bkce]:直接回車確定
……
enter a absolute path [/data/bkce]: /usr/local/blueking #輸入安裝的位置
directory /usr/local/blueking exists, are you sure to install blueking suite to /usr/local/blueking (yes/no)? yes
  • 出現(xiàn)錯(cuò)誤:
    parse cc response error 解析 cc 錯(cuò)誤
  • 解決方案:
    官方給出

    [root@localhost ~]# source /data/install/utils.fc
    [root@localhost ~]# cd /data/install
    [root@localhost install]# ./bkcec status all
    [root@localhost install]# ./bkcec stop gse
    [root@localhost install]# ./bkcec install gse 1
    [root@localhost install]# ./bkcec initdata gse

  • 再次執(zhí)行安裝

    [root@localhost install]# ./install_minibk -y

4、訪問(wèn)頁(yè)面

windows:修改 hosts 文件進(jìn)行域名解析

C:\Windows\System32\drivers\etc\hosts

192.168.66.35 localhost.localdomain

192.168.66.35 yppaas.bk.com

192.168.66.35 ypcmdb.bk.com

192.168.66.35 ypjob.bk.com

192.168.66.35 rbtnode1

  • 注意:登入的用戶和密碼是配置文件 globals.env 中設(shè)置的
    一般用戶為 admin,密碼為自己修改的密碼

5、網(wǎng)絡(luò)管理部署

5.1:下載插件包

下載部署第三方的網(wǎng)絡(luò)管理平臺(tái)

插件包地址https://bk.tencent.com/download_sdk/

5.2:解壓安裝

#先執(zhí)行下環(huán)境變量文件
[root@rbtnode1 ~]# source /data/install/globals.env

#上傳插件包進(jìn)行解壓安裝
[root@rbtnode1 ~]# tar xf bknetwork.tgz -C /data/src/

[root@rbtnode1 ~]# tar xf /data/src/bknetwork/bknetwork-3.6.1.tgz  -C  /data/src/

[root@rbtnode1 ~]# rsync -a /data/src/bknetwork/install/  /data/install/

5.3:根據(jù)實(shí)際情況修改域名

根據(jù)實(shí)際情況修改中控機(jī)/data/install/third/globals_bknetwork.env 網(wǎng)絡(luò)管理域名等信息

5.4:部署網(wǎng)絡(luò)管理

[root@rbtnode1 ~]# cd /data/install/
[root@rbtnode1 install]# ./bkco_install bknetwork

5.5:win 系統(tǒng)添加域名解析

windows:修改 hosts 文件進(jìn)行域名解析

C:\Windows\System32\drivers\etc\hosts

192.168.66.35 bknetwork.bk.com

5.6:訪問(wèn)頁(yè)面

http://bknetwork.bk.com

6、部署 CICD 插件

6.1:下載插件包和腳本

https://bk.tencent.com/download_sdk/

6.2:解壓安裝

[root@rbtnode1 ~]# tar -xf bkce_cicdkit-1.0.0.tgz -C /data
[root@rbtnode1 ~]# tar -xf install_ce-cicdkit_fix-1.0.2.tar -C /data

注意:安裝 CICDKit 的機(jī)器可用配置不能低于 4C8G,系統(tǒng)版本不能低于 CentOS7.0,建議單獨(dú)一臺(tái)機(jī)器部署

6.3:修改配置

  • 中控機(jī) install/third/globals_cicdkit.env 域名信息(CICDKIT_FQDN)
  • install.config 新增 cicdkit 及其依賴的 mysql5.7 的配置

    [root@rbtnode1 install]# vim install.config
    192.168.66.36 mysql57,cicdkit

6.4:安裝 CICDKit 后臺(tái)

#先刷新一下環(huán)境變量
[root@rbtnode1 install]# source globals.env
[root@rbtnode1 install]# source /data/install/third/globals_cicdkit.env

#設(shè)置免密,拷貝秘鑰:
[root@rbtnode1 install]# ssh-copy-id root@192.168.66.36

#執(zhí)行數(shù)據(jù)拷貝至cicd服務(wù)器
[root@rbtnode1 install]# ./bkcec sync all

#安裝CICDKit
[root@rbtnode1 install]# ./bkco_install cicdkit

[root@rbtnode1 ~]# source /data/install/utils.fc 
[root@rbtnode1 install]# echo $CICDKIT_FQDN
cicdkit.bk.com

[root@rbtnode1 install]# vim /etc/hosts
10.18.198.92 cicdkit.bk.com

#重啟進(jìn)程
[root@rbtnode1 install]# ./bkcec stop cicdkit self
[root@rbtnode1 install]# ./bkcec start cicdkit self

6.5:部署 cicdkit-SaaS

#下載 cicdkit-SaaS 包

https://bk.tencent.com/s-mart/application/159/detail

從 PaaS 頁(yè)面中進(jìn)入開(kāi)發(fā)者中心進(jìn)行部署

6.6:訪問(wèn)頁(yè)面

7、服務(wù)器重啟后的操作

  • 確認(rèn) /etc/resolv.conf 里第一個(gè) nameserver 是 127.0.0.1,option 選項(xiàng)不能有 rotate
  • 檢查重啟機(jī)器的 crontab,是否有自動(dòng)拉起進(jìn)程的配置 crontab -l | grep process_watch,重啟后的自動(dòng)拉起主要靠 crontab
  • 中控機(jī)上確認(rèn)所有進(jìn)程狀態(tài):./bkcec status all, 正常情況下應(yīng)該都是正常拉起 RUNNING 狀態(tài),如果有 EXIT 的,則嘗試手動(dòng)拉起。手動(dòng)拉起的具體方法參考組件的啟動(dòng)停止https://docs.bk.tencent.com/bkce_install_guide/maintain.html#start_stop
  • 如果社區(qū)版所有機(jī)器同時(shí)重啟,很大概率會(huì)有很多進(jìn)程啟動(dòng)失敗,因?yàn)椴煌瑱C(jī)器上組件恢復(fù)的時(shí)間沒(méi)法控制,導(dǎo)致依賴的組件還沒(méi)啟動(dòng)起來(lái),導(dǎo)致失敗,連鎖反應(yīng)。所以這種情況,遵循和安裝時(shí)的啟動(dòng)原則:
  • 先啟動(dòng) db
  • 啟動(dòng)依賴的其他開(kāi)源組件及服務(wù)
  • 啟動(dòng)藍(lán)鯨產(chǎn)品
  • 如果已經(jīng)部署過(guò) SaaS,那么手動(dòng)拉起。

    [root@rbtnode1 ~]# cd /data/install/

    [root@rbtnode1 install]# ./bkcec start saas-o   # 正式環(huán)境
    [root@rbtnode1 install]# ./bkcec start saas-t   # 測(cè)試環(huán)境

    #檢查所有服務(wù)啟動(dòng)狀態(tài),全為RUNNING為正常,如有EXIT則手動(dòng)拉起
    [root@rbtnode1 install]# ./bkcec status all

    #手動(dòng)拉起某個(gè)服務(wù),例如
    [root@rbtnode1 install]# ./bkcec start bknetwork
    [root@rbtnode1 install]# ./bkcec status bknetwork

8、離線安裝 Agent

8.1:離線準(zhǔn)備

下載好 ISO 鏡像文件,地址如下,此 iso 鏡像已經(jīng)包含了安裝 agent 所需的軟件

https://bk.tencent.com/s-mart/community/question/466

掛載到每臺(tái)機(jī)器上:

 mkdir -p /mnt/centos7
 mount  /dev/sr0 /mnt/centos7

8.2:配置離線 repo

Vim /etc/yum.repos.d/offline-centos7.repo

 [offline-centos7]
 name=Bk repo
 baseurl=file:///mnt/centos7
 enabled=1
 gpgcheck=0

8.3:更新緩存

yum clean all
yum makecache
yum repolist

8.4:在節(jié)點(diǎn)配置中添加 Agent 即可

9、常見(jiàn)問(wèn)題總結(jié)

9.1:zookpeer 啟動(dòng)失敗

檢查日志存在臟數(shù)據(jù),日志路徑

[root@rbtnode1 ~]# rm -rf /安裝目錄/public/zk/data/version-2/
[root@rbtnode1 ~]# rm -rf /安裝目錄/public/zk/datalog/version-2/

[root@rbtnode1 ~]# cd /data/install
[root@rbtnode1 install]#./bkcec start zk
[root@rbtnode1 install]#./bkcec status zk
  檢查日志存在臟數(shù)據(jù),日志路徑

[root@rbtnode1 ~]# rm -rf /安裝目錄/public/zk/data/version-2/
[root@rbtnode1 ~]# rm -rf /安裝目錄/public/zk/datalog/version-2/

[root@rbtnode1 ~]# cd /data/install
[root@rbtnode1 install]#./bkcec start zk
[root@rbtnode1 install]#./bkcec status zk

9.2:GSE 啟動(dòng)失敗

重啟gse
[root@rbtnode1 ~]# cd /data/install
[root@rbtnode1 install]#./bkcec stop gse 1
[root@rbtnode1 install]#./bkcec initdata gse
[root@rbtnode1 install]#./bkcec start gse
[root@rbtnode1 install]#./bkcec status gse

9.3: 服務(wù)器的gse服務(wù)時(shí)而正常時(shí)而不正常

日志顯示為無(wú)法連接redis主機(jī),但是redis服務(wù)正常,根本原因是將redis和gse放入到同一臺(tái)服務(wù)器中安裝

9.4:重啟服務(wù)后訪問(wèn) SaaS 應(yīng)用都報(bào) 502

原因:重啟服務(wù)后有殘余進(jìn)程

解決方案:在開(kāi)發(fā)者中心將這些應(yīng)用重新部署

9.5:redis密碼修改不能有特殊字符,如果有特殊字符,會(huì)導(dǎo)致gse_dba服務(wù)起不來(lái),以及cmdb服務(wù)不能全部running

參考官網(wǎng)網(wǎng)址:http://docs.bk.tencent.com/bkce_maintain_faq/component/redis.html修改回正常密碼,問(wèn)題解決

9.6:部署藍(lán)鯨平臺(tái)的過(guò)程中遇到報(bào)錯(cuò)add rabbitmq user admin failed

目錄下/etc/rabbitmq下運(yùn)行命令chmod 755 *

9.7:卸載藍(lán)鯨agent 不成功,提示:組件調(diào)用異常,

服務(wù)器安裝好了之后,業(yè)務(wù)分配到其他地方, 想要卸載不成功,需要重新將主機(jī)分配到藍(lán)鯨業(yè)務(wù)中去, 并重裝agent

9.8:藍(lán)鯨服務(wù)器重啟之后,訪問(wèn)所有app出現(xiàn)訪問(wèn)不了的情況,paas_agent未顯示running狀態(tài)

運(yùn)行命令:

查看日志/data/bkce/logs/paas_agent/agent.log

./bkcec stop nginx

./bkcec start nginx

./bkcec stop appt

./bkcec start appt

./bkcec stop appo

./bkcec start appo

之后重新上下架uam ,在重新上下架app ,問(wèn)題得到解決。

9.9:bkdata服務(wù)器detect_cron提示狀態(tài)不正常

原因:crontab定時(shí)計(jì)劃任務(wù)中的格式不規(guī)范,里面有很多@號(hào),將@號(hào)刪除,并執(zhí)行下面命令問(wèn)題解決

workon monitor

supervisorctl -c /data/bkce/etc/supervisor-bkdata-monitor.conf  restart  detect_cron

9.10:配置自動(dòng)化app部署失敗,日志顯示報(bào)錯(cuò)找不到pip源

在appt及appo服務(wù)器上分別執(zhí)行以下操作,提前在在線pip環(huán)境中安裝pip包

pip download django-celery==3.1.16,然后上傳到/data/bkce/paas_agent/support-files/pkgs/目錄下;

確認(rèn)是否對(duì)應(yīng)/data/bkcd/pass_agent/apps/projects/cc-automation/code/cc-automation/requirements.txt中的依賴包版本信息;

在app的虛擬環(huán)境下安裝依賴包:

cd /data/bkce/paas_agent/apps/Envs/cc-automation/bin

source activate

pip insall –r /data/bkce/pass_agent/apps/projects/cc-automation/code/cc-automation/requirements.txt --no-index --find-links=file:///data/bkce/ paas_agent/support-files/pkgs/

pip list

deactivate

10、如何給一個(gè) SaaS 應(yīng)用加白名單

官方文檔:https://bk.tencent.com/s-mart/community/question/569

11、手動(dòng)卸載各節(jié)點(diǎn) Agent

  • 登入到各個(gè)管控節(jié)點(diǎn)服務(wù)器,然后執(zhí)行下面的操作

    停gse_agent:
    [root@node1 ~]# /usr/local/gse/agent/bin/gsectl stop

    停采集器:
    [root@node1 ~]# cd /usr/local/gse/plugins/bin/ && ./stop.sh basereport

    刪除GSE相關(guān)目錄
    [root@node1 ~]# rm -rf /usr/local/gse/ /var/log/gse/ /var/run/gse/ /var/lib/gse/

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI