溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

如何實(shí)現(xiàn)交換機(jī)成環(huán)故障分析

發(fā)布時(shí)間:2021-12-30 11:19:54 來源:億速云 閱讀:181 作者:柒染 欄目:云計(jì)算

本篇文章給大家分享的是有關(guān)如何實(shí)現(xiàn)交換機(jī)成環(huán)故障分析,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

網(wǎng)絡(luò)環(huán)路導(dǎo)致網(wǎng)絡(luò)癱瘓或中斷是我們數(shù)據(jù)中心運(yùn)維工作中經(jīng)常遇到的問題,但是在規(guī)模較大的網(wǎng)絡(luò)環(huán)境中,這種故障常常具有較強(qiáng)的隱蔽性,讓我們無法快速高效地處理。

服務(wù)臺(tái)突然接到電話,說多個(gè)業(yè)務(wù)系統(tǒng)無法訪問虛機(jī)。到了公司機(jī)房,發(fā)現(xiàn)網(wǎng)絡(luò)設(shè)備流量異常,VC控制臺(tái)多臺(tái)ESXI突然斷開,短信告警信息頻發(fā),部分VC和EXSI設(shè)備脫管。

故障描述

登錄匯聚層交換機(jī),發(fā)現(xiàn)某些端口流量異常,并且有報(bào)網(wǎng)關(guān)地址沖突。

故障排查

通過上面的檢查,初步判端故障出現(xiàn)在網(wǎng)元部分。通過查看端口登記發(fā)現(xiàn),出問題的設(shè)備主要集中在網(wǎng)元交換機(jī)2華為S3952上,于是來到7號(hào)機(jī)房,發(fā)現(xiàn)它與上聯(lián)的網(wǎng)元匯總交換機(jī)Cisco 2960的級(jí)聯(lián)端口存在故障。這下故障點(diǎn)找到了,初步認(rèn)為可能是這條網(wǎng)線壞了或者是端口假死了這樣的小問題。于是把網(wǎng)線重新插拔一下,然而故障依舊,重新?lián)Q了一條網(wǎng)線,還是不能解決故障。

分別用網(wǎng)線把筆記本電腦與這兩個(gè)級(jí)聯(lián)口接上,發(fā)現(xiàn)Cisco交換機(jī)的級(jí)聯(lián)口一直為Down狀態(tài),而華為交換機(jī)的級(jí)聯(lián)口就可以正常的UP。懷疑是Cisco這個(gè)級(jí)聯(lián)口存在故障,于是在Cisco交換機(jī)上找了一個(gè)空口并作了數(shù)據(jù),這回將兩個(gè)交換機(jī)連上,端口可用了。滿以為這下可以解決故障了,但誰知沒過多久,端口又Down掉了。

接下來又將網(wǎng)線換回原來的接口,并對(duì)該接口進(jìn)行shut、no shut操作,端口可用了,證明端口沒有問題。通過Console口查看思科交換機(jī)的日志信息,提示網(wǎng)絡(luò)內(nèi)存在環(huán)路。又仔細(xì)觀察了一下交換機(jī)的端口狀態(tài),有頻閃現(xiàn)象,短時(shí)間內(nèi)華為S3952交換機(jī)的CPU占用率達(dá)到100%,Cisco交換機(jī)的端口立刻Down了。

故障處理

故障點(diǎn)終于找到了,接下來操作就簡(jiǎn)單了。通過對(duì)3952交換機(jī)各端口的流量情況進(jìn)行查看,發(fā)現(xiàn)第14、15口的流量存在異常,而該端口所連的是IMS 3328交換機(jī)。于是將這兩個(gè)端口shut掉,關(guān)閉后網(wǎng)絡(luò)恢復(fù)正常。經(jīng)機(jī)房人員確認(rèn),BSC和CE均正常了,RNC設(shè)備還不好使。又到二層機(jī)房的RNC交換機(jī)3560上查看,發(fā)現(xiàn)級(jí)聯(lián)口Down掉了。由于有了這前面的經(jīng)驗(yàn),且網(wǎng)絡(luò)環(huán)路已經(jīng)消除了,通過對(duì)端口重啟,徹底清除了故障。

故障分析

環(huán)路到底是如何產(chǎn)生的呢?事后經(jīng)查,是工程人員在為新增AC設(shè)備時(shí)放線后,擅自將網(wǎng)線接到了交換機(jī)上。而AC設(shè)備尚未進(jìn)行數(shù)據(jù)配置VRRP等數(shù)據(jù)。由AC 之間的心跳線與交換機(jī)在二層構(gòu)成環(huán)路,而華為等交換機(jī)默認(rèn)沒有開啟loopback-detection和受控,造成了本次的故障。
如何實(shí)現(xiàn)交換機(jī)成環(huán)故障分析

經(jīng)查閱相關(guān)資料,發(fā)現(xiàn)思科交換機(jī)在默認(rèn)狀態(tài)啟用了錯(cuò)誤檢測(cè)(其中就包括環(huán)路檢測(cè)),當(dāng)檢測(cè)到網(wǎng)絡(luò)出現(xiàn)環(huán)路的時(shí)候,會(huì)自動(dòng)關(guān)閉該端口。本次故障中正是由于網(wǎng)元匯總的思科交換機(jī)及時(shí)關(guān)閉了產(chǎn)生的環(huán)路接口,才沒有對(duì)MSC、MGW、HLR等核心網(wǎng)元設(shè)備造成影響。但是當(dāng)網(wǎng)絡(luò)環(huán)路消除后,該阻塞端口無法自動(dòng)開啟,還需手動(dòng)進(jìn)行端口重啟。

經(jīng)驗(yàn)總結(jié)

現(xiàn)在的網(wǎng)絡(luò)為了安全性和穩(wěn)定性,普遍采用了冗余備份設(shè)計(jì),而操作不當(dāng)很容易造成環(huán)路。那么如何避免網(wǎng)絡(luò)環(huán)路的發(fā)生和快速高效地排查環(huán)路故障呢?主要來講有以下四點(diǎn):

⒈ 開啟交換機(jī)的環(huán)路檢測(cè)功能。

一般情況下,正規(guī)的交換機(jī)都支持端口的環(huán)回檢測(cè)功能,但是某些型號(hào)的交換機(jī)該功能默認(rèn)是關(guān)閉的,需要手動(dòng)開啟。本故障中,如果3328交換機(jī)開啟環(huán)路檢測(cè)后,只對(duì)本IMS交換機(jī)下的AC設(shè)備造成影響,而使BSC、RNC等重要網(wǎng)元不受干擾。

⒉ 對(duì)交換機(jī)暫時(shí)不用的端口全部關(guān)閉,并對(duì)Console口配置密碼

這樣,不但可以提高網(wǎng)絡(luò)的安全性,還可以避免造成誤操作。

⒊ 處理故障應(yīng)該沿著自下而上的步驟排查。

先從物理層查起,然后是數(shù)據(jù)鏈路層,以此類推。尤其注重日志信息、相關(guān)資料及其他網(wǎng)絡(luò)工具的運(yùn)用等,切記不要過分迷戀經(jīng)驗(yàn),有時(shí)候經(jīng)驗(yàn)會(huì)讓您步入歧途。

⒋“三分技術(shù),七分管理”,加強(qiáng)機(jī)房管理。

對(duì)進(jìn)入機(jī)房的工程人員,在施工前,必須嚴(yán)格履行申報(bào)審批制度;施工時(shí),要由專人隨工陪同,并做好防護(hù)措施和應(yīng)急預(yù)案。

補(bǔ)充:

破環(huán)后的網(wǎng)絡(luò)優(yōu)化

1. 部署破環(huán)協(xié)議

如果當(dāng)前的環(huán)路問題是由于物理環(huán)路引入,且沒有配置破環(huán)協(xié)議,請(qǐng)按照網(wǎng)絡(luò)規(guī)劃合理部署破環(huán)協(xié)議。以太網(wǎng)交換機(jī)常見的破環(huán)協(xié)議為STP/RSTP/MSTP、RRPP、SEP等。

2. 提升鏈路質(zhì)量和可靠性

如果當(dāng)前環(huán)路問題是由于物理鏈路質(zhì)量不可靠,存在協(xié)議報(bào)文擁塞丟失導(dǎo)致超時(shí)臨時(shí)環(huán)路,請(qǐng)檢查鏈路,并更換光纖光模塊。如果當(dāng)前問題因?yàn)閹挷蛔銓?dǎo)致協(xié)議報(bào)文被丟棄,需要擴(kuò)充帶寬或者使用聚合鏈路(4條上聯(lián)未捆綁,每2條連一個(gè)匯聚交換機(jī)),提升鏈路可靠性。

3. 部署廣播抑制提升網(wǎng)絡(luò)健壯性

為了避免再次成環(huán),成環(huán)后再次引入廣播風(fēng)暴,建議在環(huán)上設(shè)備端口下,部署廣播抑制,按照經(jīng)驗(yàn),部署1%的廣播抑制可以很好的防止廣播風(fēng)暴。

4. 部署QoS保證協(xié)議報(bào)文優(yōu)先轉(zhuǎn)發(fā)

5. 優(yōu)化網(wǎng)絡(luò)設(shè)計(jì),提升網(wǎng)絡(luò)可靠性

復(fù)雜組網(wǎng)可以通過分層控制,建議合理規(guī)劃設(shè)計(jì)接入層、匯聚層。單層組網(wǎng)內(nèi)設(shè)備數(shù)量較多時(shí),建議按照邏輯組織和地理分布,劃分不同的域。

6、做端口的MAC地址綁定,虛擬化環(huán)境漂移會(huì)麻煩

7、提高網(wǎng)關(guān)端口的優(yōu)先級(jí)

以上就是如何實(shí)現(xiàn)交換機(jī)成環(huán)故障分析,小編相信有部分知識(shí)點(diǎn)可能是我們?nèi)粘9ぷ鲿?huì)見到或用到的。希望你能通過這篇文章學(xué)到更多知識(shí)。更多詳情敬請(qǐng)關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI