您好,登錄后才能下訂單哦!
仍然會(huì)監(jiān)管ceph集群健康狀態(tài) ,很多新手對(duì)此不是很清楚,為了幫助大家解決這個(gè)難題,下面小編將為大家詳細(xì)講解,有這方面需求的人可以來(lái)學(xué)習(xí)下,希望你能有所收獲。
我們 需要 監(jiān)測(cè) 的集群 正在 運(yùn)行的各種服務(wù)進(jìn)程;集群 所有 pgs 正常 狀態(tài) 為 active + clean,其余 均為 異常 狀態(tài)
集群 基礎(chǔ) 監(jiān)測(cè) 主要包括 檢查 集群 健康狀態(tài),容量 使用 情況,monitor、osd 守護(hù) 進(jìn)程的運(yùn)行狀態(tài)(up、down)
哈哈,平時(shí) 比較懶,每次都要 輸入 那么多 ceph,有點(diǎn)煩,原來(lái) ceph 有個(gè) 交互模式(沒(méi)有 命令 記憶功能,哈哈哈,失算)
# ceph ## 查看 集群當(dāng)前 狀態(tài),HEALTH_OK、HEALTH_WARN、HEALTH_ERR ceph> health ## 效果 與 ceph -s 一樣 ceph> status ## 集群 mon 相關(guān) 信息 ceph> quorum_status ceph> mon_status
哈哈,還是 使用 命令行 操作吧,能通過(guò) 上下 按鍵 查找,同樣的命令 連續(xù)執(zhí)行時(shí), 不需要 不停的輸入
## 這兩個(gè) 命令 執(zhí)行 的效果一樣 # ceph status # ceph -s ## health : HEALTH_OK、HEALTH_WARN、HEALTH_ERR # ceph health [detail]
備注:
集群 健康 狀態(tài) "HEALTH_OK" 表示 集群 健康正常,若出現(xiàn) "HEALTH_WARN XXX num placement group stale"時(shí),等待 幾分鐘,一般 都可 自動(dòng) 恢復(fù) 正常
某些 情況下,需要 動(dòng)態(tài) 持續(xù) 的 關(guān)注 集群 事件信息
# ceph -w
集群 處于健康狀態(tài)運(yùn)行,凡事都有個(gè)度,存儲(chǔ)集群也是一樣的,不可能一直寫(xiě)入,到了后期需要關(guān)注容量狀態(tài),畢竟數(shù)據(jù)量越大,會(huì)導(dǎo)致整個(gè)集群 的性能有所降低(畢竟不好好檢測(cè)容量狀態(tài),數(shù)據(jù)阻塞導(dǎo)致的問(wèn)題可不是那么 好解決的啦);該刪的數(shù)據(jù)就刪掉,實(shí)在沒(méi)容量啦,就擴(kuò)容吧,理論上是無(wú)限擴(kuò)展;還有就是數(shù)據(jù)均衡的問(wèn)題
## ceph中,所有的數(shù)據(jù)都寫(xiě)入數(shù)據(jù)池中(抽象出來(lái)的概念) # ceph df
一般 情況下,osd 使用超過(guò)85%,就不會(huì)往該osd 寫(xiě)入數(shù)據(jù);集群整體容量超過(guò) 95%集群就不能寫(xiě)入了;可以調(diào)整配置,控制集群的容量,一般不建議調(diào)太大;osd 超過(guò) 默認(rèn)告警值 就想想數(shù)據(jù)能不能均衡;集群超過(guò)告警值, 擴(kuò)容吧。
## 配置文件中添加容量配置參數(shù),記得重啟相關(guān)服務(wù)讓配置生效 ## 哈哈,其實(shí)也可以在線(xiàn)修改配置參數(shù),后面單獨(dú)編寫(xiě)文件介紹嘍 # vim /etc/ceph/ceph.conf ... ## 集群 整體 容量 使用 上限 mon_osd_full_ratio = "0.950000" ## 單個(gè) osd 容量 使用 上限 mon_osd_nearfull_ratio = "0.850000" ...
一般 情況下,線(xiàn)上環(huán)境都會(huì)部署多個(gè)mon; 所以對(duì)集群進(jìn)行數(shù)據(jù)讀寫(xiě)時(shí),需要檢查mon狀態(tài)
## dump比stat更詳細(xì),quorum_status比dump更詳細(xì) # ceph mon stat # ceph mon dump # ceph quorum_status -f json-pretty
in:osd 加入集群
out:osd 沒(méi)有 加入集群
down:osd 加入集群,但是服務(wù)停止
up:osd 加入集群,并且服務(wù)正在運(yùn)行
## 檢查所有osd狀態(tài) # ceph osd stat # ceph osd dump # ceph osd tree
看完上述內(nèi)容是否對(duì)您有幫助呢?如果還想對(duì)相關(guān)知識(shí)有進(jìn)一步的了解或閱讀更多相關(guān)文章,請(qǐng)關(guān)注億速云行業(yè)資訊頻道,感謝您對(duì)億速云的支持。
免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。