溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶(hù)服務(wù)條款》

仍然會(huì)監(jiān)管ceph集群健康狀態(tài)

發(fā)布時(shí)間:2021-11-06 09:51:54 來(lái)源:億速云 閱讀:134 作者:柒染 欄目:建站服務(wù)器

仍然會(huì)監(jiān)管ceph集群健康狀態(tài) ,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來(lái)學(xué)習(xí)下,希望你能有所收獲。

1、簡(jiǎn)介

1.1 介紹

    我們 需要 監(jiān)測(cè) 的集群 正在 運(yùn)行的各種服務(wù)進(jìn)程;集群 所有 pgs 正常 狀態(tài) 為 active + clean,其余 均為 異常 狀態(tài)
    

1.2 集群 基礎(chǔ) 監(jiān)測(cè)

    集群 基礎(chǔ) 監(jiān)測(cè) 主要包括 檢查 集群 健康狀態(tài),容量 使用 情況,monitor、osd 守護(hù) 進(jìn)程的運(yùn)行狀態(tài)(up、down)
    

2、集群 健康 檢測(cè)

    哈哈,平時(shí) 比較懶,每次都要 輸入 那么多 ceph,有點(diǎn)煩,原來(lái) ceph 有個(gè) 交互模式(沒(méi)有 命令 記憶功能,哈哈哈,失算)
    

2.1 交互 模式下 檢測(cè) 集群 健康

# ceph

## 查看 集群當(dāng)前 狀態(tài),HEALTH_OK、HEALTH_WARN、HEALTH_ERR
ceph> health

## 效果 與 ceph -s 一樣
ceph> status

## 集群 mon 相關(guān) 信息
ceph> quorum_status
ceph> mon_status

2.2 命令行 輸入

    哈哈,還是 使用 命令行 操作吧,能通過(guò) 上下 按鍵 查找,同樣的命令 連續(xù)執(zhí)行時(shí), 不需要 不停的輸入

## 這兩個(gè) 命令 執(zhí)行 的效果一樣
# ceph status
# ceph -s

## health : HEALTH_OK、HEALTH_WARN、HEALTH_ERR
# ceph health [detail]

備注:
    集群 健康 狀態(tài) "HEALTH_OK" 表示 集群 健康正常,若出現(xiàn) "HEALTH_WARN XXX num placement group stale"時(shí),等待 幾分鐘,一般 都可 自動(dòng) 恢復(fù) 正常
    

2.3 集群 動(dòng)態(tài) 監(jiān)測(cè)

    某些 情況下,需要 動(dòng)態(tài) 持續(xù) 的 關(guān)注 集群 事件信息

# ceph -w

3、集群 容量 檢測(cè)

3.1 集群 容量 查看

    集群 處于健康狀態(tài)運(yùn)行,凡事都有個(gè)度,存儲(chǔ)集群也是一樣的,不可能一直寫(xiě)入,到了后期需要關(guān)注容量狀態(tài),畢竟數(shù)據(jù)量越大,會(huì)導(dǎo)致整個(gè)集群 的性能有所降低(畢竟不好好檢測(cè)容量狀態(tài),數(shù)據(jù)阻塞導(dǎo)致的問(wèn)題可不是那么 好解決的啦);該刪的數(shù)據(jù)就刪掉,實(shí)在沒(méi)容量啦,就擴(kuò)容吧,理論上是無(wú)限擴(kuò)展;還有就是數(shù)據(jù)均衡的問(wèn)題

## ceph中,所有的數(shù)據(jù)都寫(xiě)入數(shù)據(jù)池中(抽象出來(lái)的概念)
# ceph df

3.2 集群 容量 參數(shù)

    一般 情況下,osd 使用超過(guò)85%,就不會(huì)往該osd 寫(xiě)入數(shù)據(jù);集群整體容量超過(guò) 95%集群就不能寫(xiě)入了;可以調(diào)整配置,控制集群的容量,一般不建議調(diào)太大;osd 超過(guò) 默認(rèn)告警值 就想想數(shù)據(jù)能不能均衡;集群超過(guò)告警值, 擴(kuò)容吧。

##  配置文件中添加容量配置參數(shù),記得重啟相關(guān)服務(wù)讓配置生效
## 哈哈,其實(shí)也可以在線(xiàn)修改配置參數(shù),后面單獨(dú)編寫(xiě)文件介紹嘍
# vim /etc/ceph/ceph.conf
...
## 集群 整體 容量 使用 上限
mon_osd_full_ratio = "0.950000" 

## 單個(gè) osd 容量 使用 上限
mon_osd_nearfull_ratio = "0.850000" 
...

4、mon 檢測(cè)

    一般 情況下,線(xiàn)上環(huán)境都會(huì)部署多個(gè)mon; 所以對(duì)集群進(jìn)行數(shù)據(jù)讀寫(xiě)時(shí),需要檢查mon狀態(tài)
    

## dump比stat更詳細(xì),quorum_status比dump更詳細(xì)
# ceph mon stat
# ceph mon dump
# ceph quorum_status -f json-pretty

5、osd 檢測(cè)

5.1 osd 狀態(tài)

    in:osd 加入集群
    out:osd 沒(méi)有 加入集群
    down:osd 加入集群,但是服務(wù)停止
    up:osd 加入集群,并且服務(wù)正在運(yùn)行
    

5.2 osd 狀態(tài) 檢測(cè)

## 檢查所有osd狀態(tài)
# ceph osd stat
# ceph osd dump
# ceph osd tree

看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝您對(duì)億速云的支持。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI