高明亮 高 珊** 于 闖 石海明 劉德權(quán) 邵俊捷 賈顏菽 唐玉清 莫柳松
(1.中車長春軌道客車股份有限公司國家軌道客車工程研究中心,130062,長春;2.北京化工大學(xué)信息科學(xué)與技術(shù)學(xué)院,102299,北京; 3.北京明略科技軟件系統(tǒng)有限公司,100193,北京//第一作者,高級工程師)
在城市軌道交通快速發(fā)展的過程中,列車速度等級和乘客數(shù)量的上升引起相關(guān)系統(tǒng)以及零件的故障率逐年增加,從而對列車的安全性、舒適性、平穩(wěn)性和可用性提出了嚴(yán)格的經(jīng)濟(jì)性要求。因此,具有經(jīng)濟(jì)性和精準(zhǔn)度的維護(hù)對提高工廠產(chǎn)品生產(chǎn)的可用性、降低停機(jī)成本和提高列車運(yùn)行可靠性越來越重要。
RCM(以可靠性為中心的維修)方法是一種系統(tǒng)工程,亦是一種先進(jìn)的維修管理機(jī)制,通常用于確定設(shè)備的預(yù)防性維護(hù)要求并優(yōu)化維護(hù)系統(tǒng)。實(shí)踐證明:RCM技術(shù)如能正確地被應(yīng)用到現(xiàn)行的維護(hù)中,在保證生產(chǎn)安全性和設(shè)備可靠性的前提下,可將日常的維護(hù)工作量降到40%~70%。國內(nèi)外許多學(xué)者對RCM方法的應(yīng)用做了眾多深入的研究。文獻(xiàn)[2]率先提出了將RCM理論引入設(shè)備維護(hù)管理中的建議。文獻(xiàn)[3]將RCM方法應(yīng)用于電力系統(tǒng),并提出推行PHM(故障預(yù)測與健康管理)/RCM的建議,更系統(tǒng)、全面地認(rèn)識RCM方法的必要性和途徑,提出了評估RCM經(jīng)濟(jì)效益的一種更加準(zhǔn)確可靠的方法,充分驗(yàn)證了RCM分析方法在電力維護(hù)系統(tǒng)中應(yīng)用的可行性。文獻(xiàn)[4] 以北京大興國際機(jī)場線的直線電機(jī)車輛為研究對象,開展了采用RCM方法研究最佳維護(hù)機(jī)器設(shè)備的方案,設(shè)計(jì)開發(fā)了一款維護(hù)決策系統(tǒng),并說明了RCM方法的有效性。盡管RCM方法得到了廣泛應(yīng)用,但RCM邏輯判斷是基于FMECA(故障模式、影響和危害性分析)結(jié)果的故障模式分析和FTA(故障樹分析)故障模式邏輯圖,該決策不涉及系統(tǒng)的生命周期,當(dāng)使用RCM方法進(jìn)行設(shè)備的預(yù)防性維護(hù)時,將導(dǎo)致獲得的維護(hù)周期超出設(shè)備的可靠使用壽命范圍,并增加了設(shè)備故障的可能性。
傳統(tǒng)維護(hù)包括糾正性維護(hù)和預(yù)防性維護(hù)兩種主要類型。故障發(fā)生后或發(fā)現(xiàn)明顯故障后,應(yīng)進(jìn)行糾正性維護(hù)。然而,最好的糾正性維護(hù)只能用于非關(guān)鍵區(qū)域,這些區(qū)域的資本成本很小,故障后果很小,沒有立即的安全風(fēng)險,并且可以快速進(jìn)行故障識別和快速故障修復(fù)。
預(yù)防性維護(hù)以預(yù)定的時間間隔或根據(jù)規(guī)定的標(biāo)準(zhǔn)執(zhí)行,旨在減少物品失效或功能下降的可能性。預(yù)防性維護(hù)分為預(yù)定計(jì)劃修維護(hù)和基于狀態(tài)的維護(hù)(CBM)兩種類型。預(yù)定計(jì)劃修維護(hù)不會發(fā)生任何監(jiān)視活動。CBM不按照固定的維護(hù)間隔和計(jì)劃來執(zhí)行維護(hù)活動,相反它監(jiān)視系統(tǒng)和組件的運(yùn)行狀況來編制動態(tài)的預(yù)防維護(hù)計(jì)劃。隨著傳感器技術(shù)和人工智能的發(fā)展,CBM逐漸過渡到PHM。
基于OSA(開放系統(tǒng)架構(gòu))-CBM的PHM系統(tǒng)包括7個不同的層,其技術(shù)模塊如圖1所示。在PHM的維護(hù)決策架構(gòu)中,PHM核心功能主要為狀態(tài)監(jiān)測、健康評估和故障預(yù)測功能[5]。其中,狀態(tài)監(jiān)測功能對系統(tǒng)部件的實(shí)時運(yùn)行特征參數(shù)進(jìn)行監(jiān)測與預(yù)警;健康評估功能對系統(tǒng)部件的特征進(jìn)行提取,通過數(shù)據(jù)算法構(gòu)建評估模型來評價系統(tǒng)部件的健康度;故障預(yù)測功能根據(jù)系統(tǒng)部件的參數(shù)退化規(guī)律進(jìn)行壽命預(yù)測,以解決故障發(fā)生時間和故障模式的預(yù)測問題。
PHM預(yù)測后期研究的主要任務(wù)是評估系統(tǒng)及部件生命周期的健康狀況并估算剩余的使用壽命(RUL)。然而,實(shí)現(xiàn)可靠和有效的PHM面臨眾多難點(diǎn)。第一,通常需增加眾多傳感器從而導(dǎo)致成本增高,因此,應(yīng)詳細(xì)分析設(shè)備的投資經(jīng)濟(jì)可行性。第二, PHM的目標(biāo)是精確維護(hù),但需要監(jiān)控的參數(shù)較復(fù)雜,例如環(huán)境的復(fù)雜性、設(shè)備的內(nèi)部結(jié)構(gòu)及模糊的故障機(jī)制等,在實(shí)際應(yīng)用中不易實(shí)現(xiàn)。
考慮到車輛維護(hù)的經(jīng)濟(jì)性,最好在先進(jìn)的維護(hù)管理機(jī)制下實(shí)施PHM。尤其是同時考慮確定系統(tǒng)組件的功能及其重要性時,RCM方法是最佳的選擇。RCM方法的目的是在保證系統(tǒng)可靠性的前提下,確保維護(hù)成本、人力及經(jīng)濟(jì)最優(yōu)化,提高車輛的可用性和上線率[6]。在RCM的維護(hù)管理機(jī)制流程下,為了更精確地進(jìn)行PHM維護(hù),建議使用包含信號層、特征層和決策層的數(shù)據(jù)挖掘技術(shù)[7]。近年來,將數(shù)據(jù)挖掘技術(shù)應(yīng)用于工程實(shí)踐已受到越來越多的關(guān)注。特別是隨著先進(jìn)的傳感器和信號處理技術(shù)的飛速發(fā)展,使得融合大量的交互信息進(jìn)行數(shù)據(jù)挖掘成為可能,從而可獲得更精準(zhǔn)的PHM維護(hù)決策結(jié)果。本文提出了一種新的維護(hù)策略技術(shù),該維護(hù)策略在RCM管理框架內(nèi)將數(shù)據(jù)挖掘技術(shù)與傳統(tǒng)PHM融合,能夠更精準(zhǔn)地定義維護(hù)模型,并獲得系統(tǒng)的最優(yōu)維護(hù)間隔,計(jì)算效率高,且適用于復(fù)雜狀態(tài)系統(tǒng)的可靠性計(jì)算。
本文提出的維護(hù)決策技術(shù)如圖2所示。該維護(hù)決策技術(shù)基于RCM維護(hù)管理流程,結(jié)合PHM,可精準(zhǔn)地編制維護(hù)計(jì)劃和任務(wù),PHM通過集成數(shù)據(jù)挖掘算法,實(shí)現(xiàn)更精準(zhǔn)地監(jiān)視、診斷和預(yù)測,以提高維護(hù)決策預(yù)測精度。
圖2 基于RCM、PHM和數(shù)據(jù)挖掘的維護(hù)決策技術(shù)
維護(hù)的主要目的是節(jié)約成本。復(fù)雜設(shè)備維護(hù)成本巨大,RCM可以有效地組織PHM來優(yōu)化解決方案以達(dá)到目標(biāo),因此,RCM分析在軌道交通車輛維護(hù)領(lǐng)域中顯示出越來越大的重要性。
RCM分析的總體業(yè)務(wù)流程如圖3所示。
圖3 RCM分析的總體業(yè)務(wù)流程
RCM分析的總體業(yè)務(wù)流程說明如下:
1) 數(shù)據(jù)收集。為RCM分析提供輸入,包括但不限于工程設(shè)計(jì)數(shù)據(jù)、故障及檢修數(shù)據(jù)及費(fèi)用數(shù)據(jù)等。其中,工程設(shè)計(jì)數(shù)據(jù)包括產(chǎn)品結(jié)構(gòu)數(shù)、系統(tǒng)原理及部件說明、線路圖及原理圖、接口文件、司機(jī)操作手冊、途中應(yīng)急故障處理手冊等;故障數(shù)據(jù)包括運(yùn)用故障和檢修故障數(shù)據(jù),如維護(hù)時間、維護(hù)人數(shù)等;費(fèi)用數(shù)據(jù)包括部件采購價格、部件修理費(fèi)用等。
2) 分析對象選擇,確定RCM分析對象?;谲壍儡囕v的產(chǎn)品結(jié)構(gòu)在各層級執(zhí)行分析對象決策,判斷是否為重要維護(hù)項(xiàng)目(MSI),并通過RCM評審組確認(rèn)。
3) RCM定性分析,確定維護(hù)任務(wù)。從MSI功能出發(fā),明確功能故障、故障影響及故障原因,通過故障后果為導(dǎo)向的任務(wù)決斷邏輯及任務(wù)規(guī)劃策略,定義維護(hù)任務(wù)。RCM定性分析結(jié)果應(yīng)通過RCM評審組確認(rèn)。
4) 數(shù)據(jù)處理。執(zhí)行數(shù)據(jù)清洗,供數(shù)據(jù)分析使用。收集與任務(wù)相關(guān)的故障及檢修數(shù)據(jù),并進(jìn)行數(shù)據(jù)可用性評估(F3評估)、數(shù)據(jù)整合、數(shù)據(jù)查重、數(shù)據(jù)拆分、數(shù)據(jù)標(biāo)志、異常值剔除、數(shù)據(jù)映射、維護(hù)時間統(tǒng)計(jì)等數(shù)據(jù)清洗工作。
5) 數(shù)據(jù)分析。基于故障數(shù)據(jù)確定維護(hù)間隔。數(shù)據(jù)分析包括樣本量評估、分布識別、回歸分析和數(shù)據(jù)模型計(jì)算(物理風(fēng)險模型、經(jīng)濟(jì)性模型、可用度模型)?;跀?shù)據(jù)分析結(jié)果,結(jié)合維護(hù)間隔框架,綜合決策任務(wù)間隔,形成修成優(yōu)化項(xiàng)點(diǎn)。
6) RCM數(shù)據(jù)處理與數(shù)據(jù)分析過程應(yīng)通過RCM評審組確認(rèn)。
7) 基于經(jīng)評審的RCM定性與定量分析結(jié)果,編制RCM檢修規(guī)程。
8) RCM成果應(yīng)用與評估。建立合理的RCM檢修規(guī)程應(yīng)用驗(yàn)證方案,通過修程優(yōu)化前后車輛及部件的可靠性分析與評估,判斷RCM檢修項(xiàng)點(diǎn)及間隔的合理性,確保RCM修程應(yīng)用不會對安全及服務(wù)可靠性造成不可接受的影響。
RCM分析方法可幫助維護(hù)管理者確定潛在的故障并提供可行的維護(hù)方案,有助于定義最佳的故障管理策略。PHM建立在RCM方法論的基礎(chǔ)上。PHM本身不是一個過程。通過融合二者,形成一種綜合維護(hù)策略,從而使維護(hù)管理者能夠以最優(yōu)成本效益的方式提高系統(tǒng)和設(shè)備的維護(hù)水平。同時,PHM決策包括了許多功能和舉措、程序和技術(shù),可以提高基本RCM的執(zhí)行任務(wù)。RCM將部件故障模式與功能故障相關(guān)聯(lián),賦予風(fēng)險屬性(故障影響類別),為PHM監(jiān)測對象選擇提供決策依據(jù)。RCM形成的功能故障、故障后果及故障原因的故障關(guān)聯(lián)圖譜,為PHM機(jī)理模型的構(gòu)建提供支持。RCM任務(wù)執(zhí)行層級規(guī)劃(車輛/系統(tǒng)/部件),為PHM監(jiān)控層級定義提供支持。任務(wù)檢查性能指標(biāo)即P-F指標(biāo),為PHM特征參數(shù)的提取提供依據(jù)。該指標(biāo)是衡量從潛在故障到功能故障的表征參數(shù)。其中:P點(diǎn)為潛在故障點(diǎn),F(xiàn)點(diǎn)為功能故障點(diǎn)。RCM數(shù)據(jù)處理為PHM提供經(jīng)處理的可用的潛在故障和功能故障數(shù)據(jù),為故障預(yù)測提供數(shù)據(jù)支持。精準(zhǔn)的PHM監(jiān)控和預(yù)測模型可用于替代RCM物理檢查任務(wù),這樣PHM可以有效促進(jìn)RCM分析。
為了使PHM實(shí)現(xiàn)精準(zhǔn)地預(yù)測、診斷、評估,本文融合數(shù)據(jù)挖掘算法,通過采集信號層、特征層和決策層的信息,構(gòu)建更加準(zhǔn)確的監(jiān)控診斷評估模型,從而產(chǎn)生精確的維護(hù)決策。
1.3.1 基于數(shù)據(jù)挖掘的PHM維護(hù)策略
基于數(shù)據(jù)挖掘的PHM系統(tǒng)主要包括挖掘診斷、監(jiān)控、預(yù)測等3個方面,流程如圖4所示。首先,通過感知器收集原始信號并進(jìn)行信號預(yù)處理;然后,通過相關(guān)數(shù)據(jù)算法計(jì)算并提取適當(dāng)?shù)奶卣鳎@些特征會給出有關(guān)運(yùn)行狀態(tài)的信息;最后,PHM能夠清晰識別不同故障的特征并進(jìn)行診斷分析,同時對設(shè)備健康狀況退化趨勢的特征進(jìn)行監(jiān)視和預(yù)測。
圖4 基于數(shù)據(jù)挖掘的PHM維護(hù)決策流程
首先,對特征層直接挖掘出的故障特征進(jìn)行精準(zhǔn)識別與診斷,通過決策層挖掘,最終形成維護(hù)計(jì)劃任務(wù)。針對識別故障特征特點(diǎn),提出了兩套維護(hù)策略,分別為挖掘故障診斷策略和挖掘監(jiān)控、預(yù)測策略。
針對系統(tǒng)功能部件健康退化的規(guī)律,某些特征值只能表示一段時間或者某一時刻的故障情況。不同的特征值反映的情況有可能不一致,這樣就容易導(dǎo)致多種故障決策,因此,可以考慮將多個指標(biāo)進(jìn)行融合并進(jìn)行挖掘統(tǒng)計(jì)分析,形成更加精準(zhǔn)可靠的維護(hù)決策特征值選擇方法,當(dāng)監(jiān)視的指標(biāo)超過預(yù)定量時,將觸發(fā)診斷和預(yù)測過程。直接從源數(shù)據(jù)進(jìn)行特征的提取往往取得的結(jié)果不是很準(zhǔn)確,可以考慮從特征層和決策層進(jìn)行特征的深度挖掘,從而獲得更加精準(zhǔn)的診斷結(jié)果,以及制定最佳的維護(hù)的計(jì)劃。
1.3.2 挖掘診斷決策技術(shù)研究
挖掘診斷決策技術(shù)是指針對系統(tǒng)組件故障特征明顯或者確定的情況,使用特征提取器提供故障的特征向量,然后經(jīng)過分類器進(jìn)行故障的精準(zhǔn)定位。在整個故障診斷過程中,持續(xù)監(jiān)控提取故障信號,并及時預(yù)警相應(yīng)的故障。在圖4所示的挖掘診斷決策中,系統(tǒng)部件的運(yùn)行狀態(tài)參數(shù)信號被收集的同時進(jìn)行特征提取。通過及時提取的特征可以清楚地區(qū)分不同故障。然后可以將這些生成的特征以某種方法進(jìn)行組合,例如,利用神經(jīng)網(wǎng)絡(luò)或在特征層級別進(jìn)行聚類分析。最后利用分類器對計(jì)算出的特征或挖掘特征進(jìn)行分類診斷評估。來自所有分類器的診斷決策將作為決策向量分組,并發(fā)送到特定的決策層挖掘算法中,以獲取更可靠的診斷決策。
1.3.3 挖掘監(jiān)控和預(yù)測維護(hù)決策技術(shù)
近年來,挖掘診斷決策技術(shù)研究在PHM上雖然取得了很大的進(jìn)步。但在車輛狀態(tài)監(jiān)測和預(yù)測上仍然存在許多基本問題:①需要開發(fā)用于準(zhǔn)確狀態(tài)監(jiān)測和預(yù)測的指標(biāo);②目前PHM方法通常集中在解決故障診斷問題上,系統(tǒng)性的健康評估和對退化規(guī)律的預(yù)測尚未得到很好的解決;③已實(shí)現(xiàn)的健康評估和預(yù)測算法往往僅適用于固定的應(yīng)用場景。
基于以上問題,本文提出了一個基于數(shù)據(jù)挖掘的狀態(tài)監(jiān)視和預(yù)測維護(hù)決策。狀態(tài)監(jiān)測是PHM的主要功能之一。狀態(tài)監(jiān)測可以通過實(shí)時監(jiān)測系統(tǒng)及部件的狀態(tài)來定義維護(hù)計(jì)劃任務(wù)以避免故障,但是監(jiān)控參數(shù)是不全面的,而且有特定的環(huán)境適用性,難以滿足精準(zhǔn)監(jiān)控維護(hù)的目的,因此,需要將監(jiān)控的指標(biāo)參數(shù)進(jìn)行深度數(shù)據(jù)挖掘,以確定監(jiān)測系統(tǒng)部件的退化規(guī)律信息。在本文提出的監(jiān)控和預(yù)測維護(hù)技術(shù)中,采集運(yùn)行的系統(tǒng)部件的狀態(tài)參數(shù),提取退化規(guī)律的監(jiān)控特征,然后將這些特征挖掘歸一化分類為特征層挖掘算法的輸入,同時考慮在特征提取和挖掘過程中進(jìn)行消噪處理,以期獲得明晰的部件退化規(guī)律趨勢。最后,將運(yùn)行狀態(tài)監(jiān)測參數(shù)與挖掘模型確定的最優(yōu)警報(bào)閾值和趨勢值進(jìn)行持續(xù)比較,當(dāng)達(dá)到預(yù)警值時,將觸發(fā)數(shù)據(jù)驅(qū)動的預(yù)測層決策模塊,以進(jìn)行預(yù)測層的深度挖掘。
預(yù)測層挖掘是通過評估系統(tǒng)中部件運(yùn)行報(bào)警值偏離正常運(yùn)行狀況的程度來預(yù)測產(chǎn)品未來可靠性的過程。傳統(tǒng)的方法往往是將非線性問題線性化,或者擬合為類線性進(jìn)行分析。本文使用了基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動方法。軌道交通車輛系統(tǒng)部件性能往往呈非線性或多元混沌形式,基于深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動方法可有效解決非線性擬合和高維計(jì)算問題,從而實(shí)現(xiàn)預(yù)測精度的提高。最后通過評估系統(tǒng)部件剩余使用壽命的可靠性、維護(hù)經(jīng)濟(jì)性,制定最優(yōu)的維護(hù)計(jì)劃任務(wù),為維護(hù)人員提供最優(yōu)的維護(hù)間隔、任務(wù)和資源分配,從而實(shí)現(xiàn)高水平的經(jīng)濟(jì)可靠性預(yù)防維護(hù)。
本文提出了一種先進(jìn)的維護(hù)決策技術(shù),該技術(shù)集成了RCM方法以進(jìn)行維護(hù)決策機(jī)制管理,并采用數(shù)據(jù)挖掘策略來提高預(yù)防性維護(hù)的監(jiān)控預(yù)測診斷精度。本文提出的維護(hù)決策技術(shù)主要存在如下優(yōu)勢:
1) 精益成本。整套維護(hù)策略是在RCM架構(gòu)下構(gòu)建的,可幫助維護(hù)業(yè)主確定關(guān)鍵組件及其潛在故障、最優(yōu)的維護(hù)任務(wù)以及最佳的維護(hù)間隔。整套策略支持自適應(yīng)和動態(tài)維護(hù)策略,從而達(dá)到降本增效的目的。
2) 預(yù)測維護(hù)精準(zhǔn)。通過PHM的運(yùn)行監(jiān)控、健康評估及故障預(yù)測等功能,實(shí)現(xiàn)精準(zhǔn)的預(yù)防修計(jì)劃編制,使得車輛維護(hù)趨于經(jīng)濟(jì)、可靠、安全。通過集成數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)多級挖掘以及深度挖掘,在整個維護(hù)策略中,采用基于深度學(xué)習(xí)的架構(gòu),構(gòu)建數(shù)據(jù)挖掘模型,有效地解決非線性和高維災(zāi)難問題,從而實(shí)現(xiàn)智能診斷與精準(zhǔn)預(yù)測。