溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

服務(wù)器維護(hù)清單中的7個(gè)步驟分別是什么

發(fā)布時(shí)間:2022-01-12 17:34:03 來(lái)源:億速云 閱讀:162 作者:柒染 欄目:服務(wù)器

這期內(nèi)容當(dāng)中小編將會(huì)給大家?guī)?lái)有關(guān)服務(wù)器維護(hù)清單中的7個(gè)步驟分別是什么,文章內(nèi)容豐富且以專業(yè)的角度為大家分析和敘述,閱讀完這篇文章希望大家可以有所收獲。

為了有效地維護(hù)服務(wù)器,服務(wù)器管理員必須執(zhí)行主動(dòng)的硬件和軟件檢查。而服務(wù)器的維護(hù)清單必須包括除塵、日志查看、軟件補(bǔ)丁程序測(cè)試等。

即使具有服務(wù)器的性能和冗余功能,增加的工作負(fù)載整合和可靠性期望也會(huì)對(duì)服務(wù)器硬件造成損害。

服務(wù)器維護(hù)清單應(yīng)涵蓋物理元素以及系統(tǒng)的軟件層配置。還必須考慮到以下事實(shí):徹底維護(hù)需要的時(shí)間、人工時(shí)間和測(cè)試。使用清單有助于服務(wù)器管理員定義目標(biāo),并保持IT團(tuán)隊(duì)的正常運(yùn)轉(zhuǎn)。

1.制定維護(hù)程序

服務(wù)器管理員經(jīng)常忽略計(jì)劃維護(hù)窗口。不要等到出現(xiàn)故障時(shí)才開始維護(hù);要留出時(shí)間進(jìn)行例行的服務(wù)器預(yù)防性維護(hù)。

維護(hù)頻率取決于服務(wù)器設(shè)備的使用年限、數(shù)據(jù)中心和需要維護(hù)的服務(wù)器數(shù)量。例如,與部署在高效微??諝膺^(guò)濾、冷卻良好的數(shù)據(jù)中心中的新服務(wù)器相比,位于設(shè)備柜中的老舊服務(wù)器需要更頻繁的檢查。

組織可以根據(jù)供應(yīng)商或第三方提供商的例行程序制定例行維護(hù)計(jì)劃;如果供應(yīng)商的服務(wù)合同每四個(gè)月或六個(gè)月要求進(jìn)行系統(tǒng)檢查,需要遵循這個(gè)時(shí)間表。

2.為準(zhǔn)備停機(jī)做好準(zhǔn)備

解決服務(wù)器維護(hù)清單上的項(xiàng)目之前,首先需要制定計(jì)劃。這包括檢查系統(tǒng)日志中是否有需要更加直接關(guān)注的錯(cuò)誤或事件。如果系統(tǒng)日志表明特定內(nèi)存模塊有錯(cuò)誤,則應(yīng)訂購(gòu)替換的雙列直插式內(nèi)存(DIMM)并將其安裝。同樣,如果有可用的固件、操作系統(tǒng)或代理補(bǔ)丁/更新,請(qǐng)?jiān)谟?jì)劃的維護(hù)窗口之前先進(jìn)行測(cè)試和審查。

制定明確的計(jì)劃以使系統(tǒng)脫機(jī)并使其恢復(fù)服務(wù)。在進(jìn)行虛擬化之前,服務(wù)器及其駐留的應(yīng)用程序?qū)⑿枰C(jī)才能容納維護(hù)窗口,但這迫使服務(wù)器管理員在晚上或周末實(shí)施維護(hù)。

虛擬服務(wù)器支持遷移工作負(fù)載而不是停機(jī),因此服務(wù)器管理員可以將應(yīng)用程序遷移到其他服務(wù)器,并且只要在底層主機(jī)系統(tǒng)上進(jìn)行服務(wù)器維護(hù),它們就將保持可用狀態(tài)。在維修之前,需要首先了解虛擬機(jī)的去向,將虛擬機(jī)遷移到選定的系統(tǒng),并在關(guān)閉服務(wù)器進(jìn)行維護(hù)之前驗(yàn)證每個(gè)工作負(fù)載是否正常運(yùn)行。

此時(shí),服務(wù)器管理員可以關(guān)閉服務(wù)器并將其從機(jī)架中移除。

3.檢查氣流路徑

在服務(wù)器宕機(jī)之后,需要目視檢查其外部和內(nèi)部氣流路徑。清除所有可能阻礙冷卻空氣的積塵和碎屑。

從外部空氣入口和出口開始,然后進(jìn)入系統(tǒng)機(jī)箱,查看CPU散熱器和風(fēng)扇部件、內(nèi)存,以及所有冷卻風(fēng)扇葉片和風(fēng)道。從機(jī)架上卸下服務(wù)器之后,需要確保服務(wù)器清潔。采用干凈、干燥的壓縮空氣清除防靜電工作區(qū)上的灰塵或碎屑。

除塵并不是一個(gè)新的過(guò)程,但仍然是必要的?;覊m是一種絕熱材料,因此去除灰塵尤為重要,因?yàn)樘娲睦鋮s方案和美國(guó)供暖、制冷和空調(diào)工程師學(xué)會(huì)  (ASHRAE)的建議已提高了數(shù)據(jù)中心的工作溫度?;覊m和其他氣流障礙會(huì)導(dǎo)致服務(wù)器消耗更多的能量,甚至可能導(dǎo)致組件故障。

4.檢查本地硬盤

服務(wù)器依靠?jī)?nèi)部硬盤進(jìn)行引導(dǎo)、工作負(fù)載啟動(dòng)和存儲(chǔ)以及用戶數(shù)據(jù)。磁盤介質(zhì)問(wèn)題損害了工作負(fù)載的性能和穩(wěn)定性,并導(dǎo)致硬盤過(guò)早故障。使用“檢查硬盤”實(shí)用程序之類的工具來(lái)驗(yàn)證硬盤的完整性,并嘗試恢復(fù)硬盤上的任何壞的扇區(qū)。

采用磁性媒質(zhì)的硬盤并不完美。其常見的問(wèn)題包括損壞扇區(qū)和碎片化。在發(fā)生存儲(chǔ)錯(cuò)誤后,RAID在保持?jǐn)?shù)據(jù)完整性方面有很大的進(jìn)步,但體積較小的1U機(jī)架服務(wù)器無(wú)法提供足夠的物理空間來(lái)部署硬盤陣列。

只要NT文件系統(tǒng)和文件分配表硬盤文件碎片不會(huì)消失,只要文件系統(tǒng)使用第一個(gè)可用集群的硬盤空間即可。碎片會(huì)減慢服務(wù)器硬盤的速度并導(dǎo)致故障。Optimize-Volume實(shí)用程序Windows  Server 2016對(duì)存儲(chǔ)層進(jìn)行碎片整理和處理。

5.驗(yàn)證日志數(shù)據(jù)和事件

服務(wù)器在事件日志中記錄了大量的事件信息。沒(méi)有仔細(xì)檢查系統(tǒng)、惡意軟件和其他事件日志,沒(méi)有服務(wù)器維護(hù)清單是不完整的。當(dāng)然,關(guān)鍵的系統(tǒng)問(wèn)題應(yīng)立即引起管理人員和技術(shù)人員的注意,但無(wú)數(shù)小問(wèn)題可能預(yù)示著長(zhǎng)期的問(wèn)題。

在檢查日志時(shí),管理員應(yīng)檢查報(bào)告設(shè)置并驗(yàn)證正確的警報(bào)和警報(bào)接收者。例如在檢查日志時(shí),管理員應(yīng)檢查報(bào)告設(shè)置,并驗(yàn)證正確的警報(bào)和警報(bào)接收者。例如,如果技術(shù)人員離開服務(wù)器組,則需要更新服務(wù)器的報(bào)告系統(tǒng)。

還要仔細(xì)檢查聯(lián)系方式。如果錯(cuò)誤發(fā)生在工作時(shí)間之外,則向技術(shù)人員所在公司的電子郵件地址提供發(fā)生錯(cuò)誤的報(bào)告將是無(wú)效的。

當(dāng)日志檢查發(fā)現(xiàn)長(zhǎng)期或重復(fù)出現(xiàn)的問(wèn)題時(shí),主動(dòng)調(diào)查可以在問(wèn)題升級(jí)之前解決問(wèn)題。如果服務(wù)器的日志報(bào)告內(nèi)存中的可恢復(fù)錯(cuò)誤,它將不會(huì)觸發(fā)嚴(yán)重警報(bào)。但是,如果有重復(fù)的情況表明模塊出現(xiàn)問(wèn)題,則管理員可以執(zhí)行更詳細(xì)的分析,以識(shí)別即將發(fā)生的故障。

如果問(wèn)題不夠嚴(yán)重,不會(huì)關(guān)閉服務(wù)器,管理員可以將服務(wù)器恢復(fù)到生產(chǎn)狀態(tài),直到出現(xiàn)替換硬件。

6.測(cè)試補(bǔ)丁和更新

服務(wù)器的軟件棧(BIOS、操作系統(tǒng)、管理程序、驅(qū)動(dòng)程序和應(yīng)用程序)必須協(xié)同工作。不幸的是,軟件代碼很少是沒(méi)有問(wèn)題的,所以這一難題的部分經(jīng)常被修補(bǔ)或更新,以修復(fù)錯(cuò)誤、提高安全性、簡(jiǎn)化互操作性,以及提高性能。

任何軟件都不應(yīng)具有自動(dòng)更新。管理員應(yīng)確定是否需要修補(bǔ)程序或升級(jí),然后徹底評(píng)估和測(cè)試更改。

軟件開發(fā)人員可能無(wú)法測(cè)試每種可能的硬件和軟件組合,因此需要明智地選擇補(bǔ)丁和更新,以避免性能問(wèn)題或工作流程中斷。例如,監(jiān)視代理程序補(bǔ)丁可能會(huì)導(dǎo)致重要的工作負(fù)載問(wèn)題,因?yàn)樾麓沓绦蛘加玫膸挶阮A(yù)期的要多。

向DevOps的遷移具有較小且更頻繁的更新,這增加了出現(xiàn)問(wèn)題的可能性。組織仍必須在實(shí)驗(yàn)室中測(cè)試任何修補(bǔ)程序或更新,然后才能將其部署到沙盒或測(cè)試安裝程序中,并且始終具有還原原始軟件配置的能力。

7.記錄所有系統(tǒng)更改

在維護(hù)時(shí)段內(nèi),服務(wù)器可能會(huì)發(fā)生很多事情,例如硬件、軟件或系統(tǒng)配置更改。服務(wù)器管理員完成服務(wù)器維護(hù)清單后,對(duì)他們進(jìn)行仔細(xì)檢查并記錄所有新系統(tǒng)狀態(tài)至關(guān)重要。例如,更改網(wǎng)絡(luò)適配器、添加或更換內(nèi)存或更新操作系統(tǒng)會(huì)更改系統(tǒng)的配置。

依賴系統(tǒng)配置管理工具的組織可能需要更新或發(fā)現(xiàn)任何更改,在允許系統(tǒng)重新投入使用之前,將這些更改記錄到配置管理數(shù)據(jù)庫(kù)中。服務(wù)器管理員必須更新任何強(qiáng)制的或所需的狀態(tài)配置狀態(tài),以允許進(jìn)行更改。

還要驗(yàn)證系統(tǒng)的安全狀態(tài),例如防火墻設(shè)置、反惡意軟件版本或掃描頻率和入侵檢測(cè)設(shè)置。安全檢查確保系統(tǒng)軟件的更改不會(huì)無(wú)意間暴露出在先前配置中關(guān)閉的所有攻擊面。

服務(wù)器重新聯(lián)機(jī)后,不要忘記更新任何系統(tǒng)備份或?yàn)?zāi)難恢復(fù)(DR)內(nèi)容。

驗(yàn)證服務(wù)器的備份/災(zāi)難恢復(fù)頻率保持不變,除非必須特別調(diào)整任何相關(guān)設(shè)置以反映服務(wù)器的新用例。

上述就是小編為大家分享的服務(wù)器維護(hù)清單中的7個(gè)步驟分別是什么了,如果剛好有類似的疑惑,不妨參照上述分析進(jìn)行理解。如果想知道更多相關(guān)知識(shí),歡迎關(guān)注億速云行業(yè)資訊頻道。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI