劉 磊
(昆明理工大學管理與經濟學院,云南昆明,650093)
·根本原因分析技術·
淺析根本原因分析技術在制漿造紙企業(yè)的應用
劉 磊
(昆明理工大學管理與經濟學院,云南昆明,650093)
本文介紹了一種原理上基于Reason模型、應用于制漿造紙企業(yè)的設備故障根本原因分析技術,該技術描述了設備缺陷在潛在條件觸發(fā)、主動失效產生及縱深防御失效時缺陷發(fā)展為故障的軌跡。通過收集國內某大型造紙企業(yè)典型設備故障案例,并嘗試利用因子分析、聚類分析等統(tǒng)計方法,以概念抽象化方式處理的設備各種失效形式,借用美國能源部的能源企業(yè)設備故障原因分類方法,為制漿造紙企業(yè)進行設備故障分析和信息化處理提供了分類依據(jù)。在參考其他行業(yè)應用經驗的基礎上,提出了一種適用于制漿造紙企業(yè)設備故障根本原因分析的流程。并總結了該技術在制漿造紙企業(yè)應用的理論貢獻及應用于其他過程生產企業(yè)的前景。
根本原因分析;因子分析;瑞士奶酪模型;分析技術
(E-mail: kmust2016@163.com)
1979年3月28日,美國三里島核反應堆汽輪機因壓縮空氣進水報警跳機,故障發(fā)生時因冷卻水閥門檢修后未打開,導致堆芯失水而熔化,使得放射性物質外逸造成重大核泄漏事故。
1985年11月,美國薩凡納河工廠在發(fā)生泄漏事故后,反應堆安全評估部門在綜合各種分析方法的基礎上,開發(fā)了一種方法來系統(tǒng)地評估事故,識別、記錄根本原因并分析其趨勢[1]。
1992年美國能源部在DOE 5000.3A《事故報告和操作信息處理》中規(guī)范了根本原因分析技術的操作程序。
1994年中國電力行業(yè)對生產事故調查分析程序進行了規(guī)范,將事故定義為人身傷亡、設備非計劃停運、電能質量降低和經濟損失[2]。
2001年大亞灣核電站全面學習和引進了RCA(Root Cause Analysis)分析技術和方法[3]。
故障根本原因分析技術始于核電等電力企業(yè),實際運用取得了良好的效果。因此,結合行業(yè)特點進行系統(tǒng)研究,可以針對性地總結出適用的流程。筆者通過收集制漿造紙企業(yè)典型設備故障案例,并嘗試利用因子分析、聚類分析等統(tǒng)計方法,以概念抽象化方式處理設備各種失效形式,借用美國能源部的能源企業(yè)設備故障原因分類方法,為制漿造紙企業(yè)進行設備故障分析和信息化處理提供了分類依據(jù)。在參考其他行業(yè)應用經驗的基礎上,提出了一種適用于制漿造紙企業(yè)設備故障根本原因分析的流程。
1.1 概念
故障根本原因分析常見的定義是Paradies和Busch[1]在1988年提出來的,他們認為根本原因是最基本的、可以被合理地識別、并可以通過管理和控制解決的故障原因。
美國能源部關于故障根本原因的定義為:故障發(fā)生后可以被糾正,并防止此類事故和類似事故再次發(fā)生,根本原因并非僅僅針對本次故障,而是對其他可能發(fā)生的事故有著廣泛影響。根本原因最基本的特征是可以被識別和糾正。
總之,根本原因分析技術就是一種通過回溯、邏輯推理、替換等系統(tǒng)方法識別事故發(fā)生的根本原因,并通過技術手段進行糾正以恢復設備功能,預防同樣或類似事故再次發(fā)生的技術。
1.2 故障機理探究
1990年曼徹斯特大學J.Reason博士[4]在《人因失誤》一書中首次提出了“Reason模型”概念,其目的是用于探究人為失誤的心理根源,不同于海恩里希的多米諾理論,該模型認為復雜系統(tǒng)的事故發(fā)生是源于多種因素誘發(fā)和防御機制失效的積累。
如Reason模型所描述的,可以認為設備缺陷如同一個不間斷發(fā)光的光源,如果過光線剛好能夠通過激活狀態(tài)下的主動失效和其他誘發(fā)的潛在失效漏洞時,且防御機制同時失效狀況下,故障就會發(fā)生。在故障發(fā)生時,包含各種失效因素的各個層面疊加在一起,其形狀如同瑞士奶酪(一種多孔的奶酪,奶酪片本身也可以看作防止故障發(fā)生的屏障),如圖1所示,故該模型也稱為“瑞士奶酪模型”(Swiss Cheese Model)。
當然Reason模型理論也有一定的局限性,比如模型中關于設備缺陷(孔洞)的形成機制、性質、位置都沒有詳細描述,對于故障預測不夠明確,需要結合設備失效形式及影響進一步分析和總結。
圖1 Reason模型
1.3 根本原因分析技術在制漿造紙企業(yè)應用的現(xiàn)實意義
在競爭日益白熱化的市場環(huán)境下,根本原因分析技術以查找根本原因為目的,非常適合以創(chuàng)新為內在動力、技術密集、注重設備綜合效率的制漿造紙企業(yè),可以有效控制故障停機時間,降低維修費用、提高設備綜合效率。世界上的較先進的制漿造紙企業(yè)要求對設備進行精益維護,并保持95%以上的運轉效率,其中,5%的停機時間(按每月720 h運行時間計算,5%對應36 h)包括計劃檢修時間(8~10 h)、生產損失時間(20 h)和故障停機時間,即每月平均故障停機時間要控制在3~6 h以內。據(jù)中國造紙協(xié)會調查資料,2015年我國紙及紙板生產企業(yè)約2900家,紙及紙板生產量10710萬t[6]。因此,通過應用根本原因分析技術對這0.5%~0.8%的故障停機事故進行原因溯源,消除設備維護存在的漏洞,增強縱深防御機制,避免故障再次發(fā)生,對提高我國制漿造紙企業(yè)運營綜合效率有著深遠的現(xiàn)實意義。
在目前的制漿造紙企業(yè)中,主要制造商形成了國有、民營、合資、獨資各占一部分市場份額的局面,由于多數(shù)核心生產設備主要來自歐洲,各制漿造紙企業(yè)的設備同質化趨勢明顯,但各企業(yè)由于歷史原因形成的維護體系卻不盡相同,因此代表軟實力的維護績效也參差不齊。目前各制漿造紙企業(yè)在設備維護績效考核方面一般都以設備故障時間為主要考核目標,但在故障系統(tǒng)性構架、維修歷史分析、失效模式分析方面有待加強。
設備的穩(wěn)定運行來自于可靠的設備維護技術。企業(yè)核心競爭優(yōu)勢來自于技術的核心競爭優(yōu)勢,根本原因分析技術作為以可靠性為中心的設備維護技術,是運營能力的重要組成部分,可以通過不斷的實踐和總結得以維持和發(fā)展。
根本原因分析技術既可以用于追溯以往的設備故障,也可以作為一種持續(xù)改善的前瞻性系統(tǒng)管理方法,按照一定的流程反復進行分析和驗證,直到找出根本原因,預防設備故障再次發(fā)生,還可以查找潛在的系統(tǒng)失效因素,達到優(yōu)化組織管理、減少人員傷害、降低環(huán)境影響、避免產量損失以及質量問題的效果。
本文提出的制漿造紙企業(yè)設備故障根本原因分析技術,在故障處理體系化研究方面有以下幾點貢獻。
(1)結構化故障失效形式和故障原因,形成企業(yè)自有的技術庫
結構化信息便于使用計算機維護系統(tǒng)進行數(shù)據(jù)分類存儲,并進行同類設備的前向和后向故障數(shù)據(jù)分析。
某大型制漿造紙企業(yè)的生產線為例,將設備類型、故障部位以及失效形式進行抽象化和概念化,利用降維技術處理各種復雜的設備失效形式數(shù)據(jù),以便找到各種故障的內在聯(lián)系,從而將外顯的和潛在的失效條件進行概念歸集。同時,對應于不同的設備失效形式,將故障原因進行細分和編碼,實現(xiàn)從失效形式到故障原因的數(shù)據(jù)結構化。
(2)提出了一種適合制漿造紙行業(yè)的故障根本原因分析流程
綜合各種故障查找和分析技術的優(yōu)點,同時結合實際應用,嘗試提出了一種最佳實踐路徑。該流程可以推廣應用于其他制漿造紙企業(yè),為設備維護提供應用參考。
(3)為其他領域應用提供參考
該技術流程也可以為其他業(yè)務領域和企業(yè)(如安全、化工、電力、礦山等)提供設備故障解決、根本原因分析的思路和參考,為探索和提升現(xiàn)代化大型流程工業(yè)的設備維護水平,在具體行業(yè)的故障分析技術應用方面進行有益研究。
為使研究具有代表性,選擇收集大型制漿造紙企業(yè)設備故障案例為數(shù)據(jù)源,研究的目的在于數(shù)據(jù)歸集和流程建構。案例研究方法能夠對某一特定現(xiàn)象進行深入剖析,有助于理解其內部機理,對現(xiàn)有理論進行檢驗、修正和發(fā)展[7]。
本文以制漿造紙設備為例,并利用系統(tǒng)綜合分析方法,使用統(tǒng)計分析軟件SPSS 22.0對收集的設備故障案例進行主成分分析,提取公共因子,將設備失效類型進行聚類分析,并進行編碼,總結出了符合漿紙行業(yè)設備特征的設備故障矩陣和分析流程。
2.1 根本原因技術流程設計
(1)失效類型分類及編碼
紙機設備種類繁雜,故障現(xiàn)象也是動態(tài)變化的,為便于跟蹤、分析和研究需要對各種現(xiàn)象進行抽象化和概念化處理。
①設備分類:根據(jù)設備用途可以劃分為10種類別。 ②部件分類:將設備易出現(xiàn)故障的部位進行梳理,以紙機為例,設備的主要部件可以分為72種類別。③失效形式分類:根據(jù)2015—2016年間收集的47份典型設備故障根本原因分析報告,按出現(xiàn)的典型失效形式進行了數(shù)據(jù)篩選分類,在常見的20種失效形式中整理出8種主要失效類型,分別進行了頻次統(tǒng)計后轉換為矩陣形式。
利用Kaiser正規(guī)化最大變異法進行求解并和方差統(tǒng)計,選取4個特征值大于1的主成分,其累計方差比例為93.011%,高于80%,可以認為是合理的。
選取這4個主要成分的因子作為公共因子。
如表1所示的旋轉轉換矩陣,選取主要成分的橫向最大值,分別可以得到因子:①間斷性不穩(wěn)定、無輸出、振動;②結構破損、卡澀;③電開路、外漏;④堵塞。
表1 旋轉轉換矩陣a
注 a在9疊代中收斂循環(huán)。
進一步進行系統(tǒng)聚類分析,可以將失效形式降維為四個聚集,如表2所示的各聚集組員。從表2可知,電開路、間斷性不穩(wěn)定、結構破損、無輸出、振動為聚集1,堵塞為聚集2,卡澀為聚集3,外漏為聚集4。
表2 各聚集組員
根據(jù)聚類分析,可以將失效形式編碼為如圖2中所示的四大類別。
圖2 失效形式分類
第一類為間斷性不穩(wěn)定、無輸出、振動、結構破損、電開路有較大相關性,可以歸為一類,主要以設備內部部件失效為主,可以抽象命名為組件失效;第二類為卡澀,按設備組成形式主要為缺乏潤滑,可以命名為潤滑失效;第三類為外漏,主要為設備泄漏故障,可以命名為密封失效;第四類為堵塞,可以抽象為人為因素或其他外部因素造成的設備失效形式。
針對常見的20種失效形式按聚類分析的類別重新進行合并,筆者整理為如表3所示的失效形式編碼中的17種失效類別。
表3 失效形式編碼
(2)數(shù)據(jù)收集
針對設備故障組建相應的問題解決團隊,根據(jù)故障影響程度選擇團隊成員,一般來說,團隊成員要包括設備操作人員、設備維護責任人、相關維護專業(yè)負責人。
故障發(fā)生后數(shù)據(jù)收集有多種方法,例如敘事法、時序法、人時間表格法、要因影響法、5W2H法等。
以5W2H法為例,需要識別問題的具體要素:發(fā)生了什么、為什么這樣做、誰參與、什么時間、地點、如何處理及故障發(fā)生次數(shù)。
(3)故障要因辨識
設備失效的主要原因可以采用柏拉圖法、因果分析法、頭腦風暴法、故障樹法、魚骨圖法、差異分析法、無記名分組法、屏障分析等方法進行查找。如直接故障原因未能一次明確,則根據(jù)故障的緊急程度、難度和影響范圍進行分級處理,必要時組織跨專業(yè)技術團隊進行要因辨識。
對于事故原因分類,1992年美國能源部對事故原因進行了定義,如表4所示。
表4 DOE 5000.3A 事故原因分類列表[15]
事故原因主要從設備、人員、管理、環(huán)境等方面進行了歸類,共分為7大類32小類,實踐中,為便于操作可以通過編碼作為事故原因分類選項。
(4)要因確認
對識別出來的要因,根據(jù)事故緊急情況進行確認。
①如要因單一且比較容易判定,則馬上進行現(xiàn)場確認。②如要因有多個且難以確認,需要按緊急和重要程度進行分類,分別進行要因確認,緊急情況下,更換、試驗排除法較為常用。采取替代措施后,對于需要長期跟蹤的要因多采用列表等數(shù)據(jù)分析法進行跟蹤。
(5)改善措施制定
以降低故障次數(shù)、減少故障時間、防止故障再次發(fā)生為目標,提出解決方案和預防措施。
①人為原因:以崗位培訓為主,在規(guī)則引導下進行經驗、知識和技能的有機結合。提倡TPM全員設備管理,用經驗教訓教育方式進行團隊技能和知識積累。 ②環(huán)境原因:重點關注設備失效條件消除,徹底改善現(xiàn)場設備應用和操作環(huán)境。鼓勵創(chuàng)新思維,以創(chuàng)新方法解決問題。③管理原因:完善相應的程序、流程、組織缺陷。
完善點檢、巡檢、維修規(guī)程中的缺失項目、檢查頻次、檢查方法和步驟,比如應用先進的機械、電氣、自動化、狀態(tài)監(jiān)測技術提高預測能力,特殊設備編制特定的維護計劃和維修規(guī)程。
(6)措施執(zhí)行
目的在于消除設備主動失效及潛在失效存在的條件,完善防御機制。
措施執(zhí)行時要以規(guī)程為指導、以計劃為依據(jù)、保持良好的專業(yè)溝通,避免設備二次損壞擴大故障影響層面和范圍。
措施執(zhí)行后要有后續(xù)跟蹤措施,對于確認為要因的設備故障導入缺陷動態(tài)管理庫,定期更新故障推移圖,進行長期跟蹤和缺陷狀態(tài)回顧,對于已完結的技術措施要及時進行技術確認和關閉。
(7) 根本原因確認
各種措施要進行交叉驗證,將人的因素、環(huán)境因素、管理因素對應的措施更新和固化到操作和維護規(guī)程中,跟蹤過程中發(fā)現(xiàn)類似失效形式要進行合并跟蹤,如故障再次發(fā)生則進入解決措施循環(huán)繼續(xù)查證潛在失效的原因。
2.2 根本原因分析技術實施路徑圖
根本原因分析技術遵循可識別、可管理、可控制原則,按照系統(tǒng)邏輯分析方式,根據(jù)以上描述內容進行設計,結合美國能源部RCA方法、廣東核電RCA方法、R.Keith Mobley根本失效方法并通過制漿造紙企業(yè)的實際應用,以設備缺陷存在的主動失效條件、潛在失效條件以及防御機制的漏洞為主線,按照計劃、措施、執(zhí)行、驗證的PDCA循環(huán)模式,進行設備故障根本原因分析,對各個層面因素的影響從區(qū)分、辨識、要因確認、措施制定、執(zhí)行、根本原因確認等方面進行了流程構架。筆者總結出一種具體的實施路徑流程圖如圖3所示。
圖3 根本原因分析技術實施路徑
找到根本原因并經技術確認后的要因分析、措施、根本原因作為維修記錄,形成完整的邏輯數(shù)據(jù)鏈,在數(shù)據(jù)歸類后歸檔到企業(yè)的技術庫中。
通過檢索發(fā)現(xiàn),目前制漿造紙企業(yè)尚缺乏根本原因技術的分析研究和應用文獻,本文嘗試探索出一種適用于制漿造紙企業(yè)的實施路徑。試圖將設備失效形式和根本原因通過因子分析進行結構化概念分類,其數(shù)據(jù)分析方法及結果可靠,可以用于設備故障預測性維修并指導設備維修技術策略的制定。長期運行該技術產生的各種故障維修記錄,可以構成企業(yè)設備維護技術資源大數(shù)據(jù),如將該數(shù)據(jù)作為企業(yè)的無形資產進行科學管理,有利于持續(xù)提升團隊解決問題和創(chuàng)新的能力,夯實企業(yè)的核心技術競爭優(yōu)勢。
[1] Paradies M, Busch D.Root Cause Analysis at Savannah River Plant[R].IEEE Conference on Human Factors and Power Plants, 1988 pp: 479.
[2] Power Industry Accident Investigation ProceduresDL-558-94[S]. 電業(yè)生產事故調查規(guī)程DL-558-94[S].
[3] Gao Li-gang, Lv Qun-xian.Methodology of Root Cause Analysis for Equipment Failure and its Application at Guangdong Nuclear Power Stations[J].Chinese Journal of Nuclear Science and Engineering, 2004, 24(2): 105. 高立剛, 呂群賢.設備失效根本原因分析技術和方法及其在廣東核電的應用[J].核科學與工程, 2004, 24(2): 105.
[4] Reason J.Human Error[M].Cambridge, MA: Cambridge University.1990.
[5] Keith Mobley R.Root Cause Failure Analysis[M].Woburn,MA: Butterworth-Heinemann, 1999.
[6] China Paper Association.China Paper Industry 2015 Annual Report[J].China Paper Newsletters, 2016(6): 10.中國造紙協(xié)會.中國造紙工業(yè)2015年度報告[J].造紙信息, 2016(6): 10.
[7] Eisenhardt K M, Graebner M E.Theory Building from Cases: Opportunities and Challenges[J].Academy of Management Journal, 2007, 50(1): 25.
[8] Reason J, Hollnagel E, Paries J.The SWISS CHEESE Model of Accident[M].Brusesel: Eurocontrol Experimental Center.2006.
[9] Zhao Wan, Shi Shi-jin.The Application Practice of RCA Methodology for Aerospace Products Sealing Performance Improvement[J].Quality and Reliability, 2011, 154(4): 39. 趙 婉, 石士進.根源分析方法(RCA)在航天產品密封性能改進中的應用實踐[J].質量與可靠性, 2011,154(4): 39.
[10] Reason J.The contribution of latent human failures to the breakdown of complex systems[J].Phil.Trans.R.Soc.Lond.B., 1990, 327: 475.
[11] Chen Ke-fu.Pulp and Paper Mechanic and Equipment[M].Beijing: Light Industry Press, 2003. 陳克復.制漿造紙機械與設備[M].北京: 中國輕工業(yè)出版社, 2003.
[12] LIU Chao-feng, FU Han-qing, LIU Ying-fan, et al.The Hazards,Cause and Prevention of the Failure of Existing Dryer Bearings[J].China Pulp & Paper, 2013, 32(8): 46. 劉超鋒, 付漢卿, 劉應凡, 等.在役烘缸軸承故障的危害及其產生原因和防范技術[J].中國造紙, 2013, 32(8): 46.
[13] XU Dong-ming.RCA/CA: Root Cause Analysis and Correction Action[J].Science Education and Article Collects, 2006(4): 185.徐東明.RCA/CA:根源分析和糾正措施[J].科教文匯(下半月), 2006(4): 185.
[14] Zhou Wen-guan.The Analysis of Symbelt Press and Hydraulic System[J].Paper Science & Technology, 2007, 26(1): 59. 周文管.靴型壓榨及其液壓控制系統(tǒng)分析[J].造紙科學與技術, 2007, 26(1): 59.
[15] ROOT CAUSE ANALYSIS GUIDANCE DOCUMENT(1992)[S].
(責任編輯:常 青)
Equipment Failure Root Cause Analysis Technique Based on Reason Model and Its Application in Pulp and Paper Industry
LIU Lei
(FacultyofManagementandEconomics,KunmingUniversityScienceandTechnology,Kunming,YunnanProvince, 650093)
This paper introduced a kind of equipment failure root cause analysis technique based on reason model which applied to pulp and paper enterprise maintenance.The trajectory of error must be aligned for any potential condition triggered, active failure happened and failure of defense-in-depth to occur.The common forms of equipment failure were analyzed through collecting paper enterprise cases, and tried to take advantage of factor analysis and clustering analysis methodology to build the abstract concept of various failure forms processing, using the root cause classification catalogue quoted from USA DOE rule as the basis for pulp and paper enterprises equipment failure root cause analysis information process, and RCA analysis for pulp and paper equipment failure was introduced.
root cause analysis; factor analysis; Swiss Cheese Model; analysis technique
劉 磊先生,工程師;主要從事設備維護、技術管理、技術創(chuàng)新等方面的工作與研究。
2017- 01- 25(修改稿)
C931.2
A
10.11980/j.issn.0254- 508X.2017.05.011