溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點擊 登錄注冊 即表示同意《億速云用戶服務條款》

如何使用Ganglia對Linux網(wǎng)格和集群服務器進行實時監(jiān)控

發(fā)布時間:2021-09-10 11:55:38 來源:億速云 閱讀:206 作者:chen 欄目:系統(tǒng)運維

本篇內(nèi)容介紹了“如何使用Ganglia對Linux網(wǎng)格和集群服務器進行實時監(jiān)控”的有關知識,在實際案例的操作過程中,不少人都會遇到這樣的困境,接下來就讓小編帶領大家學習一下如何處理這些情況吧!希望大家仔細閱讀,能夠?qū)W有所成!

從系統(tǒng)管理員接手服務器和主機管理以來,像應用監(jiān)控這樣的工具就成了他們的好幫手。其中比較有名的有 Nagios、 Zabbix、 Icinga 和  Centreon。以上這些是重量級的監(jiān)控工具,讓一個新手管理員來設置,并使用其中的高級特性是有些困難的。

本文將向你介紹 Ganglia,它是一個易于擴展的監(jiān)控系統(tǒng)。使用它可以實時查看 Linux 服務器和集群(圖形化展示)中的各項性能指標。

Ganglia 能夠讓你以集群(按服務器組)和網(wǎng)格(按地理位置)的方式更好地組織服務器。

這樣,我們可以創(chuàng)建一個包含所有遠程主機的網(wǎng)格,然后將那些機器按照其它標準分組成小的集合。

此外, Ganglia 的 web 頁面對移動設備進行過優(yōu)化,也允許你導出 csv 和 .json 格式的數(shù)據(jù)。

我們的測試環(huán)境包括一個安裝 Ganglia 的主節(jié)點服務器 CentOS 7 (IP 地址 192.168.0.29),和一個作為被監(jiān)控端的 Ubuntu  14.04 主機(192.168.0.32)。我們將通過 Ganglia 的 Web 頁面來監(jiān)控這臺 Ubuntu 主機。

下面的例子可以給大家提供參考,CentOS7 作為主節(jié)點,Ubuntu 作為被監(jiān)控對象。

安裝和配置 Ganglia

請遵循以下步驟,在主節(jié)點服務器安裝監(jiān)控工具。

1、 啟用 EPEL 倉庫 ,然后安裝 Ganglia 和相關工具:

# yum update && yum install epel-release # yum install ganglia rrdtool ganglia-gmetad ganglia-gmond ganglia-web

在上面這步隨 Ganglia 將安裝一些應用,它們的功能如下:

  • rrdtool,Round-Robin 數(shù)據(jù)庫,它是一個儲存并圖形化顯示隨著時間變化的數(shù)據(jù)的工具;

  • ganglia-gmetad 一個守護進程,用來收集被監(jiān)控主機的數(shù)據(jù)。被監(jiān)控主機與主節(jié)點主機都要安裝  Ganglia-gmond(監(jiān)控守護進程本身);

  • ganglia-web 提供 Web 前端,用于顯示監(jiān)控系統(tǒng)的歷史數(shù)據(jù)和圖形。

2、 使用 Apache 提供的基本認證功能,為 Ganglia Web  界面(/usr/share/ganglia)配置身份認證。

如果你想了解更多高級安全機制,請參閱 Apache 文檔的 授權與認證部分。

為完成這個目標,我們需要創(chuàng)建一個用戶名并設定一個密碼,以訪問被 Apache 保護的資源。在本例中,我們先來創(chuàng)建一個叫 adminganglia  的用戶名,然后給它分配一個密碼,它將被儲存在 /etc/httpd/auth.basic(可以隨意選擇另一個目錄 和/或 文件名, 只要 Apache  對此有讀取權限就可以。)

# htpasswd -c /etc/httpd/auth.basic adminganglia

給 adminganglia 輸入兩次密碼完成密碼設置。

3、 修改配置文件 /etc/httpd/conf.d/ganglia.conf:

Alias /ganglia /usr/share/ganglia <Location /ganglia> AuthType basic AuthName "Ganglia web UI" AuthBasicProvider file AuthUserFile "/etc/httpd/auth.basic" Require user adminganglia </Location>

4、 編輯 /etc/ganglia/gmetad.conf:

首先,使用 gridname 指令來為網(wǎng)格設置一個描述性名稱。

gridname "Home office"

然后,使用 data_source 指令,后面跟集群名(服務器組)、輪詢時間間隔(秒)、主節(jié)點主機和被監(jiān)控節(jié)點的 IP 地址:

data_source "Labs" 60 192.168.0.29:8649 # 主節(jié)點 data_source "Labs" 60 192.168.0.32 # 被監(jiān)控節(jié)點

5、 編輯 /etc/ganglia/gmond.conf。

a) 確保集群的配置類似下面。

cluster { name = "Labs" # gmetad.conf 中的  data_source 指令的名字 owner = "unspecified" latlong = "unspecified" url = "unspecified" }

b) 在 udp_send_chanel 中,注釋掉 mcast_join:

udp_send_channel   { # mcast_join = 239.2.11.71 host = localhost port = 8649 ttl = 1 }

c) 在 udp_recv_channel 中,注釋掉 mcast_join 和 bind 部分:

udp_recv_channel { # mcast_join = 239.2.11.71 ## comment out port = 8649 # bind = 239.2.11.71 ## comment out }

保存并退出。

6、打開 8649/udp 端口,使用 SELinux 確保 php 腳本(通過 Apache 運行)能夠連接到網(wǎng)絡:

# firewall-cmd --add-port=8649/udp # firewall-cmd --add-port=8649/udp --permanent # setsebool -P httpd_can_network_connect 1

7、重啟 Apache、gmetad、gmond,并確保它們啟用了“開機啟動”。

# systemctl restart httpd gmetad gmond # systemctl enable httpd gmetad httpd

至此,我們現(xiàn)在能夠打開 Ganglia 的 Web 頁面 http://192.168.0.29/ganglia 并用步驟 2 中設置的憑證登錄。

[如何使用Ganglia對Linux網(wǎng)格和集群服務器進行實時監(jiān)控][5]

Gangila Web 頁面

8、 在 Ubuntu 主機上,只需安裝 Ganglia-monitor,等同于 CentOS 上的 ganglia-gmond:

$ sudo aptitude update && aptitude install ganglia-monitor

9、 編輯被監(jiān)控主機的 /etc/ganglia/gmond.conf 文件。與主節(jié)點主機上是相同的文件,除了被注釋掉的 cluster,  udp_send_channel , udp_recv_channel 這里不應被注釋:

cluster { name = "Labs" # The name in the data_source directive in gmetad.conf owner = "unspecified" latlong = "unspecified" url = "unspecified" } udp_send_channel   { mcast_join = 239.2.11.71 host = localhost port = 8649 ttl = 1 } udp_recv_channel { mcast_join = 239.2.11.71 ## comment out port = 8649 bind = 239.2.11.71 ## comment out }

之后重啟服務。

$ sudo service ganglia-monitor restart

10、 刷新頁面,你將在 Home office grid / Labs cluster  中看到兩臺主機的各種統(tǒng)計及圖形化的展示(用下拉菜單選擇集群,本例中為 Labs):

如何使用Ganglia對Linux網(wǎng)格和集群服務器進行實時監(jiān)控

Ganglia 中 Home office 網(wǎng)格報告

使用菜單按鈕(如上指出的),你可以獲取到每臺服務器和集群的信息。還可以使用 對比主機Compare Hosts選項卡來比較集群中所有服務器的狀態(tài)。

可以使用正則表達式選擇一組服務器,立刻就可以看到它們性能的對比:

如何使用Ganglia對Linux網(wǎng)格和集群服務器進行實時監(jiān)控

Ganglia 服務器信息

我最喜歡的一個特點是對移動端有友好的總結界面,可以通過 Mobile 選項來訪問。選擇你感興趣的集群,然后選中一個主機。

如何使用Ganglia對Linux網(wǎng)格和集群服務器進行實時監(jiān)控

Ganglia 移動端總結截圖

“如何使用Ganglia對Linux網(wǎng)格和集群服務器進行實時監(jiān)控”的內(nèi)容就介紹到這里了,感謝大家的閱讀。如果想了解更多行業(yè)相關的知識可以關注億速云網(wǎng)站,小編將為大家輸出更多高質(zhì)量的實用文章!

向AI問一下細節(jié)

免責聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點不代表本網(wǎng)站立場,如果涉及侵權請聯(lián)系站長郵箱:is@yisu.com進行舉報,并提供相關證據(jù),一經(jīng)查實,將立刻刪除涉嫌侵權內(nèi)容。

AI