溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

交換機(jī)CPU負(fù)載高達(dá)90%以上(一)【新任幫主】

發(fā)布時(shí)間:2020-06-12 19:23:05 來源:網(wǎng)絡(luò) 閱讀:2068 作者:XPRJMN 欄目:網(wǎng)絡(luò)管理

交換機(jī)CPU負(fù)載高達(dá)90%以上(一)
一.前言
自從工作以來 ,接觸了很多的項(xiàng)目,也遇到了無數(shù)多的問題,有些問題看似很奇葩,其實(shí)從理論上來解
釋都是行的通的,當(dāng)然我們排除是設(shè)備或是軟件自身的bug問題,因?yàn)檫@樣的問題令人很惡心,想必同道中人
也是深有感觸吧;總結(jié)這幾年的工作,我為H3C,CISCO也提交過不少的bug信息了吧;之前在我的博客中多
數(shù)都是講解網(wǎng)絡(luò)相關(guān)的理論知識,而這樣的文章網(wǎng)上也是比比皆是;前段時(shí)間突發(fā)感慨國內(nèi)實(shí)際案例分享的是
少之又少,所以接下來在我的博客中我將為大家?guī)砦以诠ぷ髦薪?年來的工作經(jīng)歷和經(jīng)驗(yàn),與大家共享,在
提供案例的同時(shí),我盡可能還原“現(xiàn)場”,分享實(shí)際經(jīng)驗(yàn)的文章,文字內(nèi)容都是比較多的,所以博客們要想從
接下來的博文中獲取更大的利益,那只能仔細(xì)耐心的閱讀文字了,讓博客們能夠感受當(dāng)時(shí)的情景,也希望給大
家?guī)砀嗟睦妫?/p>

二.第一案例
交換機(jī)CPU負(fù)載高達(dá)90%以上(一)【新任幫主】
雪飄人間分享案例之cpu負(fù)載90%以上(一)

  1. 事發(fā)經(jīng)過
    由于這個(gè)是某公司集團(tuán)真實(shí)網(wǎng)絡(luò)環(huán)境,所以我不能將全網(wǎng)的環(huán)境在博文中體現(xiàn),只能“斷章取義”,
    但是大家放心,這個(gè)一點(diǎn)也不影響我們呈現(xiàn)當(dāng)時(shí)的問題,接著往下走吧,現(xiàn)在我們開始講故事了,希望大家可
    以聽下去!
    這是一個(gè)全新的項(xiàng)目,當(dāng)時(shí)客戶使用了自己機(jī)房,采購了4臺12510(兩臺核心,兩臺匯聚),圖中體現(xiàn)的
    就是兩臺匯聚交換機(jī)了,40多臺接入交換機(jī),495臺server,其中交換機(jī)全部都是兩倆堆疊(如圖所示);這
    個(gè)項(xiàng)目的負(fù)責(zé)人是我,我也主要掌管網(wǎng)絡(luò)這塊,還有做主機(jī)和數(shù)據(jù)庫的,當(dāng)然還有H3C廠商的人,事發(fā)當(dāng)晚,
    我們都在機(jī)房,當(dāng)時(shí)這兩個(gè)機(jī)柜機(jī)器時(shí)常不通 ,丟包嚴(yán)重,一開始我并沒有注意這塊,因?yàn)槲抑饕?fù)責(zé)規(guī)劃和
    統(tǒng)籌協(xié)調(diào)這一塊,具體的技術(shù)實(shí)施和命令配置是由廠家完成的;當(dāng)時(shí)已經(jīng)準(zhǔn)備下班回去了,業(yè)務(wù)的人開始反應(yīng)
    說機(jī)器丟包,而且越來越嚴(yán)重,我讓廠家的人先去排查,過了一段時(shí)間問他們怎么樣了 ,他們說沒什么異
    常,,,我這個(gè)時(shí)候就開始懷疑了,怎么會正常,當(dāng)時(shí)我過去登上一臺交換機(jī)查看,確實(shí)沒有什么異
    常,包括cpu和內(nèi)存使用率,不行就重啟交換機(jī)試試 ,于是我就重啟交換機(jī),因?yàn)槭切碌沫h(huán)境所以并不會有什
    么太大的影響,重啟完之后就正常了 ,我們觀察10多分鐘沒什么問題,我們就都下班了 ;
    第二天一早業(yè)務(wù)的人反應(yīng)又開始丟包,我又跑到機(jī)房去看,如果要是交換機(jī)有什么問題重啟也不應(yīng)該會恢
    復(fù)問題呀 ,再說當(dāng)時(shí)交換機(jī)流量并沒有那么大,所以也不應(yīng)該是流量造成的呀,我當(dāng)時(shí)忙于其他事情,讓廠商
    的人去排查,,可廠商的人好像已經(jīng)黔驢技窮了,不知道該怎么辦,確實(shí)丟包的問題和不通的問題排查難度
    相差很大,我當(dāng)時(shí)忙完手頭上的事情,就過去看這個(gè)問題,并且和他們說不要怕,一切都能搞定;首先我排查
    每個(gè)接口的流量,發(fā)現(xiàn)有個(gè)接口流量非常大,我就單條命令查看該接口的數(shù)據(jù)包變化,,, 后來發(fā)現(xiàn)接口的利
    用率一直在緩慢的增長,但是CPU確實(shí)很正常,大概30多分鐘,后接口的利用率竟然達(dá)到了100%;當(dāng)時(shí)我就直
    接去排查線路問題,發(fā)現(xiàn)施工隊(duì)在接線的時(shí)候接錯(cuò)了,原來是要把一個(gè)柜上的交換機(jī)到另一個(gè)機(jī)柜上的服務(wù)器
    連接起來,結(jié)果他錯(cuò)把要接在服務(wù)器上的線接在了交換機(jī)上面,導(dǎo)致我的二層拓?fù)涑霈F(xiàn)了環(huán)路(全網(wǎng)STP是關(guān)
    閉的),如下圖接線示意圖:
    交換機(jī)CPU負(fù)載高達(dá)90%以上(一)【新任幫主】
    雪飄人間分享案例之cpu負(fù)載90%以上(一)

2.總結(jié)結(jié)論
1.對于交換機(jī)而言,一般來說如果網(wǎng)絡(luò)中有環(huán)路,那么交換機(jī)的CPU會很快上升到100%,但是H3C不是
這樣的,當(dāng)時(shí)查看了CPU沒有問題,就沒有在向環(huán)路上面想,所以這是一個(gè)坑,判斷環(huán)路不能僅僅看
交換機(jī)的CPU和內(nèi)存
2.環(huán)路產(chǎn)生是由于施工隊(duì)錯(cuò)拔錯(cuò)插線路導(dǎo)致的,現(xiàn)場部署的線路確實(shí)很多也非常復(fù)雜,所以物理線路一
定要理順

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI