溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

JITStack統(tǒng)一監(jiān)控平臺與事態(tài)管理

發(fā)布時(shí)間:2020-06-20 21:33:41 來源:網(wǎng)絡(luò) 閱讀:531 作者:JITStack 欄目:云計(jì)算

事態(tài)管理(Event Management),原來稱作事件管理,是ITIL運(yùn)營管理體系中的一個(gè)主要流程之一。所謂Event(事態(tài))是指對于配置項(xiàng)或IT服務(wù)有重要意義的狀態(tài)變化。比如IT系統(tǒng)中的服務(wù)器
JITStack統(tǒng)一監(jiān)控平臺與事態(tài)管理
從啟動(dòng)狀態(tài)變?yōu)殛P(guān)機(jī)狀態(tài)、一個(gè)應(yīng)用服務(wù)狀態(tài)從Up到down的狀態(tài)變化等等。Event一詞還用于表示任何 IT 服務(wù)、配置項(xiàng)或監(jiān)視工具創(chuàng)建通知。事態(tài)通常需要 IT 運(yùn)營人員采取行動(dòng),并且通常導(dǎo)致事件記入日志。在ITIL V4中事態(tài)管理已經(jīng)更新為監(jiān)控與事態(tài)管理。

高效的IT服務(wù)運(yùn)營有賴于對于基礎(chǔ)設(shè)施、操作系統(tǒng)、應(yīng)用系統(tǒng)等IT系統(tǒng)的狀態(tài)的及時(shí)了解,并發(fā)現(xiàn)較于正常以及預(yù)期工作的任何偏差。以便盡快采取措施修正系統(tǒng)的偏差,這一功能需要通過出色的監(jiān)控系統(tǒng)來實(shí)現(xiàn)。

人們往往會混淆監(jiān)控和事態(tài)管理,兩者雖然密切相關(guān),但是還是有著本質(zhì)的區(qū)別。監(jiān)控通常以高度自動(dòng)化的方式進(jìn)行,并可以主動(dòng)或被動(dòng)地進(jìn)行采集被監(jiān)控項(xiàng)的狀態(tài)。事態(tài)管理則側(cè)重于記錄和管理由組織定義為事態(tài)的狀態(tài)監(jiān)視和狀態(tài)變更。強(qiáng)調(diào)對于運(yùn)營管理有意義的狀態(tài)變化并進(jìn)行管理,確定事態(tài)的重要性、以及識別和啟動(dòng)正確的操作以管理它們。
JITStack統(tǒng)一監(jiān)控平臺與事態(tài)管理

監(jiān)控對于事態(tài)管理是必要的,但不是所有監(jiān)控都會導(dǎo)致檢測到事態(tài),并非所有事態(tài)都具有相同的意義或需要相同的響應(yīng)。事態(tài)可以分級、通??梢苑譃樾畔ⅲ↖nformation)、告警(Warning)、例外(Exception)。信息在識別時(shí)不需要采取行動(dòng),但可以在事后的分析過程中提供數(shù)據(jù)支撐以采取措施改進(jìn)服務(wù)。告警通常在達(dá)到一定的條件下觸發(fā),使團(tuán)隊(duì)能夠在業(yè)務(wù)發(fā)生實(shí)際負(fù)面影響之前采取措施應(yīng)對。而例外則表明已經(jīng)實(shí)際發(fā)生了違反預(yù)定義規(guī)范的事態(tài),異常事態(tài)一定要采取措施。

通過監(jiān)控工具或自動(dòng)化監(jiān)控對象的做法可能會產(chǎn)生大量數(shù)據(jù),但如果沒有關(guān)于如何限制,過濾和使用此數(shù)據(jù)的明確政策和策略,那么它將毫無價(jià)值。
JITStack統(tǒng)一監(jiān)控平臺與事態(tài)管理

JITStack集合主流開源監(jiān)控平臺并結(jié)合在監(jiān)控領(lǐng)域的實(shí)施經(jīng)驗(yàn),為客戶組織打造縱向?qū)哟位?、橫向大規(guī)模可擴(kuò)展的靈活、成熟、可擴(kuò)展的可視化統(tǒng)一監(jiān)控解決方案。方案以Zabbix、Prometheus、ELK為開源監(jiān)控平臺,Grafana技術(shù)框架為開源可視化平臺,結(jié)合Ansible開源自動(dòng)化技術(shù),打造縱向可以監(jiān)控從硬件基礎(chǔ)設(shè)施、系統(tǒng)、應(yīng)用狀態(tài)、業(yè)務(wù)數(shù)據(jù),虛擬化環(huán)境、容器,日志等全方位信息系統(tǒng)以及對監(jiān)控?cái)?shù)據(jù)的分析、展示;橫向可以實(shí)現(xiàn)從監(jiān)控小規(guī)模幾臺到幾十臺的中小規(guī)模的集中式高可用部署,到監(jiān)控幾千臺設(shè)備的分布式監(jiān)控系統(tǒng)部署。

客戶組織利用JITStack監(jiān)控系統(tǒng)平臺實(shí)行監(jiān)控和事態(tài)管理流程中的重要活動(dòng):

定義監(jiān)控項(xiàng):確定哪些配置項(xiàng),設(shè)備、系統(tǒng)、服務(wù)及其組件并確定監(jiān)控策略。

實(shí)施和維護(hù)監(jiān)控:利用設(shè)備、系統(tǒng)自身的監(jiān)控功能或者使用專用的監(jiān)控工具可實(shí)現(xiàn)監(jiān)控,不同的系統(tǒng)產(chǎn)生的大量監(jiān)控?cái)?shù)據(jù),各種事件分布在不同的系統(tǒng)中,如主機(jī)、網(wǎng)絡(luò)設(shè)備的本身往往都有不同的監(jiān)控系統(tǒng),其監(jiān)控信息、事態(tài)告警都分布在各自的監(jiān)控系統(tǒng)中,通過JITStack統(tǒng)一監(jiān)控系統(tǒng)將各種監(jiān)數(shù)據(jù)匯集到統(tǒng)一監(jiān)控系統(tǒng)、有利于簡化事態(tài)管理復(fù)雜性,提高運(yùn)維效率。

修正降噪:由于系統(tǒng)之間的耦合,同一個(gè)故障可能會導(dǎo)致各個(gè)不同的層級關(guān)聯(lián)系統(tǒng)產(chǎn)生一系列相關(guān)的事態(tài)信息、告警和例外,使運(yùn)營團(tuán)隊(duì)淹沒于大量告警之中,增加了排查處理問題的難度。JITStack通過修正降噪方案,將相同原因的事態(tài)告警合并,只顯示有限數(shù)量的事態(tài)通知,幫助運(yùn)營團(tuán)隊(duì)專注于處理有意義的告警通知,提高效率。

建立維護(hù)閾值:確定哪些狀態(tài)變化將被視為事態(tài)、并選擇標(biāo)準(zhǔn)對事態(tài)進(jìn)行分級。JITStack監(jiān)控系統(tǒng)默認(rèn)支持6級安全級別定義,滿足更精細(xì)、靈活的響應(yīng)操作管理。

JITStack監(jiān)控系統(tǒng)支持分級層次多途徑通知,結(jié)合客戶組織實(shí)際,建立和維護(hù)應(yīng)如何處理每級事態(tài)的政策以及適當(dāng)?shù)墓芾?,在JITStack監(jiān)控平臺實(shí)施定義的閾值,標(biāo)準(zhǔn)和策略所需流程,并結(jié)合自動(dòng)化工具實(shí)現(xiàn)運(yùn)維管理的自動(dòng)化。
JITStack統(tǒng)一監(jiān)控平臺與事態(tài)管理
利用JITStack監(jiān)控平臺進(jìn)行監(jiān)控與事態(tài)管理對于業(yè)務(wù)和運(yùn)營管理價(jià)值:

其重要之處在于監(jiān)控系統(tǒng)結(jié)合事態(tài)事態(tài)管理流程提供了早期發(fā)現(xiàn)故障的機(jī)制,在實(shí)際服務(wù)中斷發(fā)生之前,就可以檢測到故障并分配給相關(guān)團(tuán)隊(duì)采取措施。當(dāng)整合服務(wù)管理的其他流程時(shí),如故障管理、問題管理時(shí),事態(tài)管理能夠利用監(jiān)控信息作為輸入提供事態(tài)基礎(chǔ)數(shù)據(jù),顯示出狀態(tài)變化、異?,F(xiàn)象,使相關(guān)人員或團(tuán)隊(duì)能夠盡早響應(yīng),提高響應(yīng)效率,從而使業(yè)務(wù)受益于整體運(yùn)維效率的提升。監(jiān)控與事態(tài)管理為自動(dòng)化操作奠定了基石,運(yùn)維自動(dòng)化可以提高運(yùn)營效率,并使昂貴的人力資源解放出來投入到更具創(chuàng)新價(jià)值的工作中去。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI