葉順流
摘? 要:故障報(bào)告、分析和糾正措施系統(tǒng)(FRACAS)是用于產(chǎn)品故障歸零進(jìn)而實(shí)現(xiàn)可靠性增長(zhǎng)的管理系統(tǒng),其實(shí)現(xiàn)方案與產(chǎn)品特點(diǎn)和研制流程的適應(yīng)性是確保系統(tǒng)有效可用的關(guān)鍵。本文根據(jù)核電廠儀控系統(tǒng)研制工作的特點(diǎn),提出了一種基于開(kāi)源缺陷跟蹤工具Bugzilla實(shí)現(xiàn)FRACAS故障閉環(huán)流程的技術(shù)方案。該方案以數(shù)據(jù)定義和流程配置為核心,將可靠性信息和故障處理流程進(jìn)行整合,實(shí)現(xiàn)定制化故障管理系統(tǒng)。結(jié)合在某型儀控系統(tǒng)研制階段的實(shí)際應(yīng)用,記錄并解決了大量的故障。通過(guò)分析采集的故障數(shù)據(jù)發(fā)現(xiàn),儀控系統(tǒng)實(shí)際發(fā)生故障與可靠性預(yù)計(jì)故障在分布趨勢(shì)上具有一致性,為儀控系統(tǒng)的可靠性設(shè)計(jì)和維修策略提供了參考,并驗(yàn)證了該實(shí)現(xiàn)方案的有效性。
關(guān)鍵詞:FRACAS? 儀控系統(tǒng)? 故障數(shù)據(jù)? 可靠性? Bugzilla
中圖分類(lèi)號(hào):TP273? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A? ? ? ? ? ? ? ? ? 文章編號(hào):1674-098X(2021)01(a)-0038-05
Abstract:Failure reporting, analysis and corrective action system (FRACAS) is a management system used for return-to-zero of product failure and achieving reliability growth. The key to ensure the system effective and functional is that implementation scheme should be compatible with product features and development workflow. According to development work characteristics of instrument and control (I&C) system for nuclear power plant, a technical scheme is proposed to implement FRACAS failure close-loop process based on an open source bug-tracking tool named Bugzilla. The core work of the scheme is data definition and workflow configuration. Reliability information and failure process are integrated to achieve customized failure management system. Combining with actual application in the development phase of a certain type of I&C system, large amount of failure is recorded and solved with the system. Accumulated failure data indicates that actually occurred failure and predicted failure of the I&C system show consistency in distribution trend. It provides reference for reliability design and maintenance strategy of I&C system, while the implementation scheme is proved to be effective.
Key Words:FRACAS; I&C system; Failure data; Reliability; Bugzilla
為確保核電廠能安全穩(wěn)定地運(yùn)行,其儀控系統(tǒng)應(yīng)當(dāng)具有相當(dāng)高的可靠性和安全性水平。在產(chǎn)品研制階段盡早發(fā)現(xiàn)并解決潛在故障,是提高核電廠儀控系統(tǒng)固有可靠性的有效方法。GB/T 9225中提出,為了估計(jì)儀控系統(tǒng)的可靠性,其數(shù)學(xué)模型要求各個(gè)部件故障率數(shù)值作為輸入,需建立相應(yīng)的數(shù)據(jù)程序。故障報(bào)告、分析和糾正措施系統(tǒng)(FRACAS)就是一種有效的故障管理方式,在軍工、航空和軌道交通等領(lǐng)域有廣泛應(yīng)用。針對(duì)核電廠儀控系統(tǒng)的FRACAS也有原理和使用流程方面的研究[1],但在實(shí)現(xiàn)方案以及運(yùn)行數(shù)據(jù)方面的研究較少。
現(xiàn)有FRACAS實(shí)現(xiàn)方案主要以專(zhuān)業(yè)的商用軟件為主,如部分軌道裝備產(chǎn)品研制單位的FRACAS軟件[2-3]。由于該類(lèi)信息化軟件需要根據(jù)企業(yè)的實(shí)際工作流程和架構(gòu)進(jìn)行定制開(kāi)發(fā),購(gòu)置費(fèi)用也相對(duì)較高。結(jié)合到核電廠儀控系統(tǒng)研制階段對(duì)故障管理的特定需求,考慮到實(shí)際情況,嘗試以通用流程管理工具為基礎(chǔ)進(jìn)行自定義配置,從而實(shí)現(xiàn)FRACAS的核心功能。
1? 基于Bugzilla的FRACAS實(shí)現(xiàn)方案
FRACAS的核心是故障數(shù)據(jù)記錄和故障閉環(huán)流程,與通用的流程管理系統(tǒng)具有一定的相似性。Bugzilla是一款B/S架構(gòu)的開(kāi)源缺陷跟蹤工具,主要用于軟件開(kāi)發(fā)過(guò)程的缺陷跟蹤。該工具中的缺陷記錄和流程跟蹤功能與FRACAS中的故障報(bào)告和故障閉環(huán)方法具有共通性,差異在于FRACAS面向產(chǎn)品全壽命周期的可靠性問(wèn)題,與產(chǎn)品構(gòu)型、故障模式、維修措施、故障率以及可靠性分析等信息關(guān)聯(lián),缺陷跟蹤更側(cè)重于問(wèn)題本身的記錄和關(guān)閉過(guò)程??紤]到兩者在數(shù)據(jù)記錄和流程驅(qū)動(dòng)方面的相似性,以及Bugzilla靈活的系統(tǒng)配置和數(shù)據(jù)查詢(xún)功能,選用該工具進(jìn)行了自定義配置,用以實(shí)現(xiàn)符合需求的FRACAS系統(tǒng)。
1.1 核電廠儀控系統(tǒng)的FRACAS系統(tǒng)架構(gòu)
通用的FRACAS要求在GJB 841-90中進(jìn)行了詳細(xì)說(shuō)明,結(jié)合儀控系統(tǒng)研制工作的實(shí)際需求,并參考文獻(xiàn)[4]中的FRACAS架構(gòu)設(shè)計(jì),對(duì)本工作預(yù)期實(shí)現(xiàn)的FRACAS進(jìn)行架構(gòu)設(shè)計(jì),具體如圖1所示。
其中,數(shù)據(jù)管理和閉環(huán)流程部分以Bugzilla工具自定義配置實(shí)現(xiàn),數(shù)據(jù)采集和數(shù)據(jù)統(tǒng)計(jì)部分暫時(shí)由研發(fā)人員以該FRACAS系統(tǒng)為依托手動(dòng)錄入故障信息和篩選可靠性數(shù)據(jù)。由于Bugzilla現(xiàn)有功能模塊沒(méi)有可靠性相關(guān)的專(zhuān)業(yè)算法,指標(biāo)計(jì)算和趨勢(shì)統(tǒng)計(jì)需要結(jié)合數(shù)據(jù)篩選導(dǎo)出功能進(jìn)行輔助開(kāi)展。
本文主要工作集中在結(jié)合儀控系統(tǒng)的架構(gòu)、模塊和故障相關(guān)的數(shù)據(jù)定義,通過(guò)故障信息與產(chǎn)品信息進(jìn)行關(guān)聯(lián),將自定義的FRACAS流程以通用流程驅(qū)動(dòng)功能進(jìn)行配置實(shí)現(xiàn),從而實(shí)現(xiàn)產(chǎn)品信息、故障信息、故障狀態(tài)、人員分配以及流程步驟等定制化。
1.2 Bugzilla的數(shù)據(jù)和流程配置
1.2.1 數(shù)據(jù)項(xiàng)配置
參考圖1中的數(shù)據(jù)采集和數(shù)據(jù)管理部分,故障數(shù)據(jù)不只包括軟件缺陷,需要擴(kuò)展到所有可靠性問(wèn)題,并與產(chǎn)品構(gòu)型關(guān)聯(lián)。因此,在Bugzilla中定義了研制中的儀控系統(tǒng)、硬件模塊、軟件模塊、版本號(hào)、故障發(fā)生階段、故障狀態(tài)、故障描述模板以及嚴(yán)酷度等信息作為輸入。對(duì)于FRACAS中的故障報(bào)告表、故障分析報(bào)告表等內(nèi)容,以模板化格式在故障描述中進(jìn)行記錄,如故障現(xiàn)象、故障模式、分析說(shuō)明、故障原因以及糾正措施建議等信息,并且可用于后續(xù)數(shù)據(jù)篩選時(shí)作為關(guān)鍵字。數(shù)據(jù)項(xiàng)配置情況如圖2所示。
1.2.2 故障閉環(huán)流程配置
FRACAS故障閉環(huán)流程的核心是推動(dòng)故障的分析和解決,針對(duì)不同的企業(yè)組織架構(gòu)和研制流程需要進(jìn)行適應(yīng)性調(diào)整。文獻(xiàn)[5-6]介紹了針對(duì)柴油機(jī)和系留氣球定制的故障閉環(huán)流程,文獻(xiàn)[1]中介紹了核電廠安全級(jí)DCS系統(tǒng)產(chǎn)品FRACAS的工作流程。綜合參考以上方案,并結(jié)合儀控系統(tǒng)研發(fā)工作實(shí)際情況,自定義了適合當(dāng)前核電廠儀控研制工作的故障閉環(huán)流程,具體如圖3所示。
基于Bugzilla的工作流自定義功能,將以上流程和節(jié)點(diǎn)進(jìn)行了相應(yīng)配置。故障報(bào)告對(duì)應(yīng)測(cè)試人員發(fā)起的未確認(rèn)故障,根據(jù)故障涉及的硬件或軟件自動(dòng)分配給設(shè)定的產(chǎn)品負(fù)責(zé)人進(jìn)行核實(shí)和分配,即故障處于已指定狀態(tài)。收到報(bào)告的故障負(fù)責(zé)人基于故障描述信息,結(jié)合故障復(fù)現(xiàn)情況進(jìn)行故障定位、原因分析,并采取相應(yīng)措施,即處于分配和解決狀態(tài)之間的過(guò)渡態(tài)。根據(jù)處理情況再進(jìn)行糾正措施有效性驗(yàn)證,測(cè)試人員通過(guò)回歸測(cè)試驗(yàn)證故障是否有效解決,并根據(jù)結(jié)果選擇下一個(gè)流程是解決或重新打開(kāi)故障。以上各個(gè)狀態(tài)可在Bugzilla工作流定義功能中進(jìn)行選擇配置,配置過(guò)程示意如圖4所示。
圖4中已勾選方塊代表可選的故障處理流程節(jié)點(diǎn)及相互轉(zhuǎn)換的約束關(guān)系,每個(gè)節(jié)點(diǎn)定義了默認(rèn)產(chǎn)品負(fù)責(zé)人和待指定的故障負(fù)責(zé)人,各個(gè)節(jié)點(diǎn)的負(fù)責(zé)人執(zhí)行圖3中各個(gè)流程的工作項(xiàng),并記錄該工作項(xiàng)的分析和實(shí)施情況。通過(guò)上述流程配置,將角色和流程進(jìn)行約束,使工作流以設(shè)計(jì)的FRACAS流程運(yùn)行。
1.2.3 其他配置
FRACAS是流程驅(qū)動(dòng)的故障閉環(huán)管理方式,可通過(guò)新任務(wù)郵件通知和截止時(shí)間告警等方式有效地推動(dòng)故障處理流程。在Bugzilla中也對(duì)相關(guān)通知機(jī)制和鏈接進(jìn)行了配置。
統(tǒng)計(jì)分析是FRACAS另一個(gè)重要功能,是實(shí)現(xiàn)故障數(shù)據(jù)反饋于產(chǎn)品設(shè)計(jì)的重要方式。由于Bugzilla在數(shù)據(jù)統(tǒng)計(jì)上的功能相對(duì)簡(jiǎn)單,缺乏可靠性專(zhuān)業(yè)相關(guān)的算法,且無(wú)法與可靠性預(yù)計(jì)和FMEA等工作進(jìn)行整合,因此,暫時(shí)通過(guò)數(shù)據(jù)查詢(xún)和導(dǎo)出的方式獨(dú)立開(kāi)展統(tǒng)計(jì)分析。具體應(yīng)用情況在下一節(jié)詳細(xì)介紹。
2? FRACAS系統(tǒng)的統(tǒng)計(jì)數(shù)據(jù)分析
上述基于Bugzilla自定義配置實(shí)現(xiàn)的FRACAS已在多個(gè)核電廠儀控系統(tǒng)的研制工作中得到應(yīng)用,并采集了一定數(shù)量的故障數(shù)據(jù)。以下根據(jù)某型儀控系統(tǒng)調(diào)試測(cè)試階段收集的硬件故障數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)分析。通過(guò)將統(tǒng)計(jì)數(shù)據(jù)與可靠性預(yù)計(jì)數(shù)據(jù)進(jìn)行對(duì)比分析,評(píng)估了FRACAS的運(yùn)行情況和應(yīng)用效果,并綜合分析了產(chǎn)品的故障風(fēng)險(xiǎn)。
由于調(diào)試和測(cè)試階段的故障報(bào)告時(shí)間與測(cè)試工作的安排相關(guān),因此時(shí)間因素在該階段為非應(yīng)力因子,只作為故障的標(biāo)識(shí)信息。因此以下分析中不包含故障隨時(shí)間變化的趨勢(shì)分析,該分析可在產(chǎn)品進(jìn)入運(yùn)行和維護(hù)階段后進(jìn)行。該階段受設(shè)計(jì)、制造、操作等因素的影響較大,為系統(tǒng)性失效而非隨機(jī)性失效,且數(shù)量樣本較小,因此分析結(jié)果只做定性參考。
從系統(tǒng)級(jí)故障統(tǒng)計(jì)看,某型儀控系統(tǒng)研制階段的硬件故障數(shù)據(jù)統(tǒng)計(jì)如圖5所示。
這與通常對(duì)產(chǎn)品可靠性的認(rèn)知是一致的。產(chǎn)品可靠性是設(shè)計(jì)出來(lái)的,其次是制造出來(lái)的。需求不明、設(shè)計(jì)偏差和制造工藝缺陷是可靠性問(wèn)題的最主要原因?;诠收显蚍诸?lèi),更有針對(duì)性地開(kāi)展更確切的需求分析和嚴(yán)格的設(shè)計(jì)評(píng)審,可有效降低主要故障類(lèi)型。
從模塊電路級(jí)故障統(tǒng)計(jì)看,對(duì)FRACAS硬件故障統(tǒng)計(jì)數(shù)據(jù)和可靠性預(yù)計(jì)值進(jìn)行了綜合分析。以某型DO功能模塊為例,對(duì)硬件故障按電路功能單元進(jìn)行劃分,對(duì)其故障分布進(jìn)行了定量統(tǒng)計(jì)對(duì)比,具體如表1所示。
將統(tǒng)計(jì)故障和失效率預(yù)計(jì)值按各電路故障所占百分比進(jìn)行對(duì)比,進(jìn)行硬件故障分布趨勢(shì)分析,如圖6所示。
基于FRACAS統(tǒng)計(jì)數(shù)據(jù)和設(shè)計(jì)階段的可靠性預(yù)計(jì)值發(fā)現(xiàn),兩者在分布趨勢(shì)上呈現(xiàn)一致性,即故障風(fēng)險(xiǎn)主要集中在DO輸出通道、人機(jī)交互(包括LED、接口)和電源管理部分。因此,可以從DO通道故障診斷、接口部分ESD保護(hù)以及電源散熱等方向有效地提高可靠性。同時(shí),基于歷史故障信息可進(jìn)一步優(yōu)化前期FMEA分析的結(jié)果,將實(shí)際發(fā)生故障與預(yù)測(cè)的故障模式進(jìn)行綜合分析,更準(zhǔn)確地評(píng)估故障模式的風(fēng)險(xiǎn)水平[7]。
3? 結(jié)語(yǔ)
本文基于對(duì)開(kāi)源工具Bugzilla的工作流、數(shù)據(jù)項(xiàng)和相關(guān)功能自定義,介紹了一種面向核電儀控系統(tǒng)研制需求的FRACAS系統(tǒng)實(shí)現(xiàn)方案。通過(guò)將該系統(tǒng)應(yīng)用于核電廠儀控系統(tǒng)研制工作,推進(jìn)了故障解決進(jìn)度,積累了產(chǎn)品在研制階段的可靠性信息,為新產(chǎn)品的研發(fā)提供了可靠性設(shè)計(jì)的經(jīng)驗(yàn),為系統(tǒng)維修提供了故障定位和解決的經(jīng)驗(yàn)庫(kù)。根據(jù)產(chǎn)品的故障統(tǒng)計(jì)分布情況,結(jié)合設(shè)計(jì)階段開(kāi)展的可靠性分析工作,對(duì)比驗(yàn)證了可靠性預(yù)計(jì)結(jié)果與實(shí)際發(fā)生的故障分布具有一致性。下一步的工作方向是將該FRACAS與可靠性設(shè)計(jì)和分析工作進(jìn)一步整合,持續(xù)優(yōu)化產(chǎn)品的可靠性設(shè)計(jì),并將該系統(tǒng)拓展應(yīng)用到產(chǎn)品運(yùn)行階段,以獲取更貼近實(shí)際使用場(chǎng)景的可靠性數(shù)據(jù),更有效地分析和解決故障。
參考文獻(xiàn)
[1] 許標(biāo),馬權(quán),彭勇,等.FRACAS在核電廠安全級(jí)DCS產(chǎn)品故障管理過(guò)程中的應(yīng)用[J].儀器儀表用戶(hù),2018,25(2):71-74.
[2] 李敏,宋玉慶,劉偉.FRACAS在城軌動(dòng)車(chē)企業(yè)的應(yīng)用[J].機(jī)械設(shè)計(jì)與制造工程,2016,45(4):60-62.
[3] 田雅華.基于售后服務(wù)現(xiàn)場(chǎng)的故障分析報(bào)告和糾正措施系統(tǒng)的建立及應(yīng)用[J].鐵道機(jī)車(chē)與動(dòng)車(chē),2016(6):25-28.
[4] 沈佳塔,丁春光,葛智君,等.基于流程驅(qū)動(dòng)的FRACAS的設(shè)計(jì)與應(yīng)用研究綜述[J].電子產(chǎn)品可靠性與環(huán)境試驗(yàn),2018,36(S1):248-253.
[5] 李兆勇,林淑彥,張振勝,等.FRACAS在裝備制造企業(yè)中的應(yīng)用研究[J].內(nèi)燃機(jī)與動(dòng)力裝置,2017,34(4):75-78.
[6] 聞麗,理海濤.故障報(bào)告、分析和糾正措施系統(tǒng)的應(yīng)用研究[J].航空標(biāo)準(zhǔn)化與質(zhì)量,2017(2):46-48.
[7] 孟玉慈,孫東旭,梁媛.利用歷史故障信息提升機(jī)載計(jì)算機(jī)FMEA分析準(zhǔn)確性[J].航空計(jì)算技術(shù),2017,47(4):126-129.