溫馨提示×

溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊×
其他方式登錄
點(diǎn)擊 登錄注冊 即表示同意《億速云用戶服務(wù)條款》

怎么用5個Why分析法做故障復(fù)盤

發(fā)布時間:2021-12-27 18:08:01 來源:億速云 閱讀:591 作者:柒染 欄目:大數(shù)據(jù)

本篇文章給大家分享的是有關(guān)怎么用5個Why分析法做故障復(fù)盤,小編覺得挺實(shí)用的,因此分享給大家學(xué)習(xí),希望大家閱讀完這篇文章后可以有所收獲,話不多說,跟著小編一起來看看吧。

最近有位研發(fā)同學(xué)參與故障復(fù)盤,將他的分析發(fā)給我double check,發(fā)現(xiàn)部分的故障原因沒有太深入的挖掘,停留在了表面現(xiàn)象,導(dǎo)致后續(xù)制定的行動項可能治標(biāo)不治本。這種現(xiàn)象其實(shí)還挺普遍,我們可以嘗試使用一種簡單有效的根因分析(RCA:root cause analysis)方法來更好做故障復(fù)盤:5個Why分析法(5 whys)。

方法論

方法概述[1]

5 Whys是一種反復(fù)詢問的技巧,用于探索特定問題背后的因果關(guān)系。該技術(shù)的主要目標(biāo)是通過重復(fù)問題“為什么?”來確定缺陷或問題的根本原因每個答案構(gòu)成下一個問題的基礎(chǔ)。名稱中的“5”源于對解決問題所需迭代次數(shù)的軼事觀察。


5個why方法故障復(fù)盤主要的思想

  1. 拉長邏輯鏈條,找到深層原因

  2. 拋棄主觀假設(shè)和邏輯陷阱

  3. 分清現(xiàn)象與原因

  4. 步步分析,不直接跳躍下結(jié)論

  5. 原因永遠(yuǎn)不在個人身上,不要將諸如“人為疏忽”,“沒有注意”作為根因


5個why方法主要步驟

  1. 分解問題,找到現(xiàn)象[2]

  2. 問5個why(注意這里的5是概數(shù),可以小于5,也可以大于5),直到無法再問why,找到根因。

  3. 從最后的答案反過來問,看邏輯鏈?zhǔn)欠穹聪虺闪?,進(jìn)行驗證。

怎么用5個Why分析法做故障復(fù)盤

實(shí)踐

舉幾個例子來說明如何使用。這邊取1個經(jīng)典案例及1個我參與過的歷史線上故障復(fù)盤案例舉例(當(dāng)時復(fù)盤沒有使用5個why分析,所以我們可以看看區(qū)別)。


經(jīng)典案例

現(xiàn)象:一個博物館的東邊外墻面上有非常嚴(yán)重的腐蝕,需要經(jīng)常涂刷新的油漆。

淺顯的分析及措施:經(jīng)過調(diào)查以后,你發(fā)現(xiàn),原來博物館的清潔人員在洗墻的時候,用了一種高腐蝕度的清潔劑,這才導(dǎo)致了墻面的腐蝕。所以后續(xù)的措施是,在噴刷修補(bǔ)了這一次的墻面以后,要求清潔人員下次清洗墻面時換用低腐蝕度的清潔劑。

5個Why分析及措施:

第一個why:為什么這個清潔工要用高腐蝕度的清潔劑?

答:因為東邊的墻上經(jīng)常有很多鳥糞粘著,用一般的清潔劑洗不干凈

第二個why:為什么東邊的墻上有很多鳥糞?

答:因為墻上有很多蜘蛛,而這些鳥以蜘蛛為食,所以經(jīng)常在墻附近活動

第三個why:為什么墻上有很多蜘蛛?

答:因為墻上有很多小蟲子,而蜘蛛以這些小蟲子為食

第四個why:為什么墻上有很多小蟲子?

答:因為東面墻上有幾扇窗子,晚上,博物館里的光會從這里透出去,而這些趨光性很強(qiáng)的蟲子就被光吸引過來了。

所以解決方案是:在窗戶那里安裝遮光性很強(qiáng)的厚窗簾,每天太陽落山之前拉上窗簾。

好了,我們似乎拿到了根因及解決方案,我們反過來再推導(dǎo)一遍:

  1. 厚窗簾拉上后趨光性很強(qiáng)的蟲子就不會被吸引【符合邏輯】

  2. 趨光性很強(qiáng)的蟲子不再聚集,蜘蛛不會再來聚集【符合邏輯】

  3. 蜘蛛不再來聚集,吃蜘蛛的鳥不再經(jīng)常來活動【符合邏輯】

  4. 吃蜘蛛的鳥不再經(jīng)常來活動,東面的墻不再有很多鳥糞【符合邏輯】

  5. 東面的墻不再有很多鳥糞,清潔工不需要用高腐蝕度的清潔劑【符合邏輯】

  6. 不適用高腐蝕度的清潔劑,墻面不再總是被腐蝕【符合邏輯】

至此,我們確定拿到了根因及正確的解決方案。


故障復(fù)盤案例

現(xiàn)象:商戶使用銀行打款流水號查詢賬單發(fā)現(xiàn)交易記錄缺失

淺顯的分析及措施:(之前沒有使用5個why分析得到的結(jié)論)由于get(0)只拿到了部分?jǐn)?shù)據(jù),所以研發(fā)重新做代碼的全量get(0)分析。


5個Why分析及措施:

第一個why:為什么使用流水號查詢交易記錄有缺失?

答:因為客戶期望的是能用這個流水號查詢到多筆(天)賬單信息

第二個why:為什么同一個流水號有多筆(天)賬單信息?

答:因為銀行周六、周日休息,將合并周五、周六、周日賬單一并打款,生成同一個流水號,關(guān)聯(lián)到多筆(天)賬單信息

第三個why:為什么一個流水號關(guān)聯(lián)了多筆(天)賬單信息,系統(tǒng)沒有返回?

答:因為代碼內(nèi)使用了get(0)方法,只取了第一項數(shù)據(jù)

第四個why:為什么代碼內(nèi)使用了get(0)方法?

答:因為get(0)方法在編碼中沒有被禁止/提醒,研發(fā)在開發(fā)中沒有注意到風(fēng)險

所以解決方案是:在研發(fā)架構(gòu)層面宣導(dǎo)get(0)風(fēng)險,使用明確的業(yè)務(wù)語義來定義代碼處理替換get(0),在代碼掃描工具中提醒get(0)屬于高風(fēng)險編碼。

反過來推導(dǎo)驗證:

  1. 研發(fā)架構(gòu)層面了解get(0)風(fēng)險,在代碼提交時被提醒為高風(fēng)險編碼,研發(fā)會謹(jǐn)慎使用get(0)或者避免使用get(0)【符合邏輯】

  2. 所有研發(fā)謹(jǐn)慎使用get(0),如果選擇繼續(xù)使用get(0),那么在提交查詢賬單的編碼中,工具提示風(fēng)險【符合邏輯】

  3. 工具提示get(0)風(fēng)險后,在設(shè)計編碼時,研發(fā)關(guān)注業(yè)務(wù)場景是否存在一對多的場景【符合邏輯】

  4. 研發(fā)關(guān)注業(yè)務(wù)場景存在一對多的場景,一定程度上更有可能分析和感知到銀行合并打款場景【符合邏輯】

反向推導(dǎo)邏輯鏈正確,解決方案成立,且該解決方案沒有歸結(jié)于人的處理,而歸結(jié)于架構(gòu)治理及工具。而之前的解決方案僅僅關(guān)注了get(0)在當(dāng)時代碼里面的風(fēng)險,并不持續(xù)跟蹤,所以僅僅治標(biāo)未治本。

以上就是怎么用5個Why分析法做故障復(fù)盤,小編相信有部分知識點(diǎn)可能是我們?nèi)粘9ぷ鲿姷交蛴玫降?。希望你能通過這篇文章學(xué)到更多知識。更多詳情敬請關(guān)注億速云行業(yè)資訊頻道。

向AI問一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場,如果涉及侵權(quán)請聯(lián)系站長郵箱:is@yisu.com進(jìn)行舉報,并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

why
AI