編者按
根本原因分析(RCA)是人們尋找觀測(cè)結(jié)果根本原因的過(guò)程。在故障分析的背景下,RCA用于尋找經(jīng)常發(fā)生或重大機(jī)器故障的根本原因。本文介紹了幾種根本原因分析工具(如5why分析法、魚(yú)骨圖、失效模式與影響分析、故障樹(shù)分析和帕累托圖等),以及兩個(gè)根本原因分析的案例。原文載于2021年5月的《質(zhì)量文摘》(QualityDigest),作者布萊恩·克里斯蒂安森(Bryan Christiansen)是Limble CMMS公司的創(chuàng)始人和首席執(zhí)行官。
根本原因分析(RCA)工具為如何進(jìn)行根本問(wèn)題調(diào)查提供了堅(jiān)實(shí)基礎(chǔ)。每種RCA工具都有自己的優(yōu)點(diǎn),不同行業(yè)和問(wèn)題類型需要應(yīng)用某些特定的工具。每個(gè)公司及其管理團(tuán)隊(duì)在進(jìn)行RCA時(shí)可能都有一個(gè)需要遵守的規(guī)范,不同的公司會(huì)偏愛(ài)不同的技術(shù)工具。在某些情況下,一些公司會(huì)引入外部顧問(wèn)來(lái)進(jìn)行RCA。顧問(wèn)一般也會(huì)使用一種首選的技術(shù)工具或技術(shù)工具組合。這些就是為什么很難為RCA創(chuàng)建一個(gè)人人都能遵循的通用模板的原因之一。
通常情況下,一個(gè)公司會(huì)有自己首選的RCA技術(shù)工具。如果這種技術(shù)工具不能給出需要的答案,才會(huì)探索其他方法。
“5why”工具是為RCA而開(kāi)發(fā)的,它像一個(gè)好奇的孩子一樣,利用問(wèn)“為什么(why)”來(lái)解決問(wèn)題。當(dāng)我們?cè)儐?wèn)為什么會(huì)發(fā)生現(xiàn)有的問(wèn)題時(shí),我們可以追蹤其原因。然后,我們就可以對(duì)自己剛剛確定的原因問(wèn)為什么。
這個(gè)過(guò)程可以一直繼續(xù)下去,直到?jīng)]有必要再問(wèn)“為什么”為止。到那時(shí),我們應(yīng)該已經(jīng)找到了問(wèn)題的根本原因。根據(jù)經(jīng)驗(yàn),詢問(wèn)并找到接下來(lái)5個(gè)“為什么”的答案應(yīng)該足以揭示大多數(shù)問(wèn)題的根本原因,這也是“5why分析法”名字的由來(lái)(例見(jiàn)圖1)。
圖1 旨在發(fā)現(xiàn)事件根本原因的問(wèn)題流
用于RCA的魚(yú)骨圖(又名石川圖)方法,源于日本“質(zhì)量圈”運(yùn)動(dòng)的倡導(dǎo)者石川馨在日本造船業(yè)中采用的質(zhì)量控制技術(shù)。這種方法所生成的圖形看起來(lái)像魚(yú)骨,因此也被稱為魚(yú)骨圖(見(jiàn)圖2)。魚(yú)骨圖基于以下想法:有多重因素(包括被稱為“5M”的5個(gè)主要因素)導(dǎo)致了我們正在調(diào)查的故障/事件/影響。
圖2 魚(yú)骨圖
5M分別是:人員、機(jī)器、環(huán)境、方法、材料。
在魚(yú)骨圖中,問(wèn)題或故障被寫在圖右端的“魚(yú)頭”部位。其原因沿著水平線表示。進(jìn)一步的結(jié)果和它們各自的原因被寫在代表每個(gè)5M的魚(yú)骨上。這個(gè)過(guò)程可以一直進(jìn)行下去,直到團(tuán)隊(duì)找到了根本原因?yàn)橹埂?/p>
魚(yú)骨圖可作為結(jié)構(gòu)化頭腦風(fēng)暴會(huì)議的視覺(jué)輔助工具,同樣的技術(shù)也用于產(chǎn)品設(shè)計(jì)、人體工程學(xué)設(shè)計(jì)和工藝改進(jìn)等。
失效模式與影響分析(FMEA)是一種主動(dòng)的RCA方法,可防止機(jī)器或系統(tǒng)的潛在故障。它是一種結(jié)合了可靠性工程、安全工程和質(zhì)量控制工作的系統(tǒng)方法,試圖通過(guò)分析過(guò)去的數(shù)據(jù)來(lái)預(yù)測(cè)未來(lái)的故障和缺陷。
一個(gè)多元化的跨職能團(tuán)隊(duì)對(duì)于實(shí)施FMEA至關(guān)重要。對(duì)分析的范圍必須進(jìn)行明確定義,并清楚傳達(dá)給所有團(tuán)隊(duì)成員??缏毮軋F(tuán)隊(duì)?wèi)?yīng)對(duì)每個(gè)子系統(tǒng)、設(shè)計(jì)和過(guò)程進(jìn)行仔細(xì)審查,對(duì)每個(gè)系統(tǒng)的目的、需要和功能進(jìn)行合理質(zhì)疑,并對(duì)潛在的失效模式進(jìn)行頭腦風(fēng)暴??缏毮軋F(tuán)隊(duì)還可以對(duì)過(guò)去類似的工藝和產(chǎn)品故障進(jìn)行分析,從而對(duì)工藝進(jìn)行完善。
進(jìn)行FMEA時(shí),需要評(píng)估每種識(shí)別出的故障模式可能導(dǎo)致的潛在影響和中斷,并用于計(jì)算其風(fēng)險(xiǎn)優(yōu)先級(jí)數(shù)(RPN,見(jiàn)圖3)。如果故障模式的RPN高于公司所能接受的值,則必須通過(guò)更改一個(gè)或多個(gè)因素來(lái)解決該問(wèn)題。
圖3 風(fēng)險(xiǎn)優(yōu)先級(jí)數(shù)(RPN)
故障樹(shù)分析(FTA)是一種利用布爾邏輯找出故障原因的RCA方法。這種方法最初是由貝爾實(shí)驗(yàn)室開(kāi)發(fā)的,用于評(píng)估美國(guó)空軍的洲際彈道導(dǎo)彈(ICBM)發(fā)射控制系統(tǒng)。
故障樹(shù)分析試圖映射故障和機(jī)器的子系統(tǒng)之間的邏輯關(guān)系。我們正在分析的故障位于圖表的頂部,信息通過(guò)表示輸入和輸出事件之間關(guān)系的各種“門”向下流動(dòng)(見(jiàn)圖4)。如果兩個(gè)原因由一個(gè)邏輯或門(OR gate)組合導(dǎo)致結(jié)果發(fā)生,則將它們與邏輯或運(yùn)算符組合在一起。例如,如果一臺(tái)機(jī)器在運(yùn)行或維護(hù)過(guò)程中發(fā)生故障,這是一個(gè)邏輯或關(guān)系。
圖4 故障樹(shù)
如果兩個(gè)原因需要同時(shí)發(fā)生才能導(dǎo)致故障,則用邏輯與門(AND gate)表示。例如,如果機(jī)器只有在操作人員按錯(cuò)按鈕和繼電器無(wú)法激活時(shí)才發(fā)生故障,這是一個(gè)邏輯與關(guān)系,使用布爾與符號(hào)表示。
在故障樹(shù)分析圖中,可使用不同的符號(hào)表示不同類型的事件,如圓形用于基本事件、五邊形用于外部事件、菱形用于未探明事件、橢圓用于條件事件、矩形用于中間事件等。
通過(guò)分析故障樹(shù),進(jìn)行可能的改進(jìn)和風(fēng)險(xiǎn)管理,這是對(duì)自動(dòng)化機(jī)器和系統(tǒng)進(jìn)行RCA的有效工具。
意大利經(jīng)濟(jì)學(xué)家維爾弗雷多·帕累托發(fā)現(xiàn),他所能觀察到的幾乎所有頻率分布都有一個(gè)共同的主題:在比率和它們所造成的影響之間存在著巨大的不對(duì)稱性。根據(jù)經(jīng)驗(yàn),他指出,在任何系統(tǒng)中,80%的結(jié)果(或故障)是由20%的潛在原因造成的。
這個(gè)法則被稱為帕累托法則(有人稱之為“80-20法則”)。從人與人之間的財(cái)富分配到機(jī)器的故障等,這種因果之間的偏差都明顯存在。
根據(jù)帕累托法則,在分析了故障及其可能的原因后,用柱狀圖和線圖表示故障發(fā)生的頻率和故障產(chǎn)生的原因(例見(jiàn)圖5)。通過(guò)這種圖,我們可以觀察到原因和故障之間的偏差。通常,我們會(huì)發(fā)現(xiàn)一些小的因素是如何導(dǎo)致大多數(shù)故障的。然后,進(jìn)一步分析導(dǎo)致最多故障的原因,并采取糾正措施以消除最常見(jiàn)的故障。
圖5 帕累托圖——襯衫缺陷
帕累托圖是確定RCA優(yōu)先級(jí)的極佳工具。根據(jù)帕累托法則,消除20%最常見(jiàn)的故障原因,可以使故障總數(shù)減少80%。根據(jù)機(jī)器的臨界狀態(tài)、特定部件的沖擊故障或兩者的結(jié)合,帕累托圖將表明需要進(jìn)一步調(diào)查和解決的最主要故障原因。
RCA是開(kāi)放式的、在各個(gè)行業(yè)中擁有許多廣泛使用的工具。除了上面提到的工具,還有還有一些值得注意的RCA其他工具。
·因果圖:魚(yú)骨圖是因果圖的一個(gè)例子,還有許多類似的工具試圖映射系統(tǒng)中原因和結(jié)果之間的關(guān)系。
·改善:另一種來(lái)自日本的工藝改進(jìn)工具。它是一種持續(xù)的過(guò)程改進(jìn)方法,RCA被嵌入改善的結(jié)構(gòu)。
·障礙分析:這是一種RCA技術(shù),通常用于安全事故分析。它的前提是:人員和潛在危險(xiǎn)之間的屏障可以防止大多數(shù)安全事故。
·變化分析:當(dāng)一個(gè)潛在事件由于單個(gè)因素的變化而發(fā)生時(shí),變化分析常被當(dāng)作RCA技術(shù)。
·散點(diǎn)圖:散點(diǎn)圖是一種繪制二維圖表中兩個(gè)數(shù)據(jù)之間關(guān)系的統(tǒng)計(jì)工具。它也可以作為RCA工具使用。
RCA示例1
注塑機(jī)在世界各地被廣泛應(yīng)用于制造各種形狀的塑料制品。機(jī)器生產(chǎn)的塑料制品應(yīng)符合相同規(guī)格,并在允許的公差范圍內(nèi)。假設(shè)有一種塑料制品的次品發(fā)生率很高,我們需要弄清楚它的根源。
首先,需要明確界定問(wèn)題。這包括解釋塑料制品的精確缺陷。通過(guò)觀察輸出,我們可以確定是否出現(xiàn)了注塑過(guò)程中可能發(fā)生的四個(gè)主要缺陷之一,如:溢料;充氣和排氣;零件變形;模具缺陷。
我們假設(shè)缺陷是零件變形。此時(shí)必須清楚地將問(wèn)題記錄下來(lái),次品問(wèn)題以百分比的形式體現(xiàn)。一旦完成該步驟,就必須收集所有可用的數(shù)據(jù)。維護(hù)日志可以從計(jì)算機(jī)維護(hù)管理系統(tǒng)(CMMS)中提取,可以查看注塑機(jī)制造商的手冊(cè)等。
在這個(gè)過(guò)程中,應(yīng)收集每一件次品的信息,測(cè)量零件與規(guī)范的偏差。當(dāng)產(chǎn)品從模具中取出后,立即獲取其熱特征。料筒中熔融塑料的溫度也要被測(cè)量。
我們知道,零件變形幾乎總是由于溫度問(wèn)題引起的。但我們不能確定溫度問(wèn)題出現(xiàn)在哪個(gè)環(huán)節(jié)——是在加熱的料筒中,還是在冷卻的模具里。根據(jù)收集到的數(shù)據(jù),我們可以確定這個(gè)問(wèn)題。
讓我們假設(shè)成品的熱特征與預(yù)期的不同。這就斷定問(wèn)題出在冷卻過(guò)程中。進(jìn)一步研究發(fā)現(xiàn),問(wèn)題的根源在于冷卻液管道的空間布置不當(dāng)。最后,改變模具中冷卻液管道的位置即可解決零件變形的問(wèn)題。
RCA示例2
想象一下,對(duì)一臺(tái)因過(guò)載而停止工作的機(jī)器進(jìn)行調(diào)查時(shí)發(fā)現(xiàn),保險(xiǎn)絲熔斷了。調(diào)查顯示,這臺(tái)機(jī)器過(guò)載是因?yàn)樗囊粋€(gè)軸承沒(méi)有得到充分潤(rùn)滑。進(jìn)一步調(diào)查發(fā)現(xiàn),自動(dòng)潤(rùn)滑機(jī)有一個(gè)潤(rùn)滑泵沒(méi)有充分泵送,從而導(dǎo)致缺乏潤(rùn)滑。對(duì)該潤(rùn)滑泵的調(diào)查表明,其有一個(gè)傳動(dòng)軸磨損了。對(duì)磨損原因的調(diào)查發(fā)現(xiàn):沒(méi)有適當(dāng)?shù)臋C(jī)制來(lái)防止金屬碎屑進(jìn)入潤(rùn)滑泵,這使得廢料進(jìn)入潤(rùn)滑泵并導(dǎo)致其損壞。
問(wèn)題的根本原因是金屬?gòu)U料污染了潤(rùn)滑系統(tǒng),解決這個(gè)問(wèn)題應(yīng)該可以防止一系列事件的再次發(fā)生。如果沒(méi)有過(guò)濾器來(lái)防止金屬?gòu)U料進(jìn)入系統(tǒng),那么真正的根本原因可能是設(shè)計(jì)問(wèn)題?;蛘?,如果它的過(guò)濾器由于缺乏例行檢查而被阻塞,那么真正的根本原因是維護(hù)問(wèn)題。
與此相比,如果調(diào)查沒(méi)有找到因果要素,那么整改措施可能是更換保險(xiǎn)絲、軸承或潤(rùn)滑泵,這可能會(huì)讓機(jī)器重新運(yùn)行一段時(shí)間。但在根本原因得到解決之前,問(wèn)題可能會(huì)再次出現(xiàn)。
RCA是一種復(fù)雜的方法,不應(yīng)一時(shí)興起倉(cāng)促進(jìn)行,這樣團(tuán)隊(duì)可能會(huì)決定抄近路以節(jié)省時(shí)間并加快流程。如果你想要了解任何復(fù)雜事件的真相,匆忙的流程可能會(huì)對(duì)整個(gè)項(xiàng)目不利。如果你有充分的理由進(jìn)行RCA,那么創(chuàng)建一個(gè)可以成功執(zhí)行該過(guò)程的環(huán)境將符合你的最佳利益。