左旭濤,李世明,程中國,岳 陽,叢龍斌
(1. 青島地鐵集團有限公司,山東青島 266045,2. 東軟集團股份有限公司,遼寧沈陽 110179)
機電設(shè)備故障特征是指機電設(shè)備從使用到報廢的整個生命周期中故障的發(fā)生、發(fā)展和變化特征。機電設(shè)備故障分為如下3個階段。
(1)初期故障期(DFR型)。這個階段的故障主要由材料質(zhì)量問題、設(shè)計和制造質(zhì)量缺陷、人員操作上的錯誤、裝配失誤等引起,故障率從高到低發(fā)生變化,并隨著時間的推移趨于穩(wěn)定。
(2)偶發(fā)故障期(CFR型)。設(shè)備正常運行,狀態(tài)穩(wěn)定且故障率低,大致來說不會發(fā)生故障狀態(tài),故障主要是由意外因素造成的,如維護不當(dāng)和操作錯誤。故障的發(fā)生是隨機且不可預(yù)測的。這一時期是設(shè)備的最佳工作期。
(3)磨損故障期(IFR型)。在此期間,設(shè)備故障率急劇上升,主要是因為設(shè)備已經(jīng)使用了很長時間,部分零件老化且磨損嚴(yán)重,有效使用壽命結(jié)束。設(shè)備已經(jīng)處于異常狀態(tài),應(yīng)重點進行預(yù)防性維護工作。
目前,在機電設(shè)備的運行過程中,大多數(shù)傳感器均會產(chǎn)生實時生產(chǎn)數(shù)據(jù)。但傳統(tǒng)的監(jiān)控報警系統(tǒng)僅通過閾值預(yù)警等方式,接收個別傳感器的報警信息,很難識別整個生產(chǎn)數(shù)據(jù)的異常組合,無法對設(shè)備運行過程中的隱性異常做出預(yù)警。
基于機電設(shè)備的大量運行數(shù)據(jù),設(shè)備運行數(shù)據(jù)實時異常檢測模型通過運用數(shù)據(jù)降維、高斯混合模型等算法,實時發(fā)現(xiàn)機電設(shè)備運行數(shù)據(jù)信號間的異常組合并觸發(fā)預(yù)警,實現(xiàn)機電設(shè)備實時的異常檢測,提前發(fā)現(xiàn)問題并進行人工篩查,降低因機電設(shè)備故障而引發(fā)的突發(fā)事故概率。
本文設(shè)備運行數(shù)據(jù)實時異常檢測模型所應(yīng)用的核心算法為主成分分析方法和高斯模型。
(1)主成因分析方法(Principal Component Analysis,PCA)。這是被廣泛使用的數(shù)據(jù)降維算法之一。數(shù)據(jù)集預(yù)處理手段有降維、均值插補、高維映射等手段,降維的目的是減少冗余信息,提高計算處理速度并適當(dāng)提高計算精度,從而節(jié)省大量的時間和經(jīng)濟成本。PCA是降維的主要手段之一。
(2)高斯混合模型(Gaussian Mixture Model,GMM)。其由多個子分部的概率模型組成。通過觀察數(shù)據(jù)在總體的概率分布,采用高斯概率密度函數(shù)(正態(tài)分布曲線)準(zhǔn)確量化事物。高斯混合模型可以使用任何的概率分布,具有良好的計算性能,并且其分布具備準(zhǔn)確的數(shù)據(jù)性質(zhì),可尋找出小概率出現(xiàn)的數(shù)據(jù),該部分?jǐn)?shù)據(jù)認(rèn)為是異常數(shù)據(jù)。
機電設(shè)備的性能衰減、壽命降低是由量變到質(zhì)變的動態(tài)過程。設(shè)備健康及狀態(tài)評估通過對機電設(shè)備的運行狀態(tài)進行監(jiān)視與評估,分析設(shè)備微觀和動態(tài)損傷過程中的演變過程、特點和規(guī)律,及時預(yù)測設(shè)備的使用壽命,實現(xiàn)事前預(yù)防、過程監(jiān)控、動態(tài)養(yǎng)護等。
本文采用的機電設(shè)備健康及狀態(tài)評估模型核心算法為威布爾分布算法。威布爾分布算法是可靠性分析和壽命檢驗的理論基礎(chǔ),作為一種連續(xù)的分布,它能夠描述各種類型機電設(shè)備零部件故障數(shù)據(jù)的分布規(guī)律。威布爾分布在機電設(shè)備可靠性工程中被廣泛應(yīng)用,尤其適用于機電類設(shè)備的磨損累計失效的分布形式。由于它可以利用概率值很容易地推斷出數(shù)據(jù)的分布參數(shù),因而被廣泛應(yīng)用于各種壽命試驗的數(shù)據(jù)處理。威布爾分布是連續(xù)性的概率分布,其函數(shù)模型為:
式(1)中,t為時間;m是形狀參數(shù);η是標(biāo)準(zhǔn)參數(shù);γ是位置參數(shù)。
機電設(shè)備的故障期主要分為初期故障期(DFR型)、偶發(fā)故障期(CFR型)、磨損故障期(IFR型)3種。結(jié)合威布爾分布函數(shù)模型的推算,故障率的曲線函數(shù)模型圖如圖1所示。
圖1 故障率的曲線函數(shù)模型圖
(1)當(dāng)m<1時,設(shè)備部件處于初期故障期(DFR型),設(shè)備運行前期多做計劃檢修,保障設(shè)備正常運行,后期故障數(shù)趨于穩(wěn)定后,可降低檢修頻率。
(2)當(dāng)m= 1時,設(shè)備部件處于偶發(fā)故障期(CFR型),故障多是偶發(fā),所以多做監(jiān)視,總結(jié)規(guī)律,合理安排計劃檢修。
(3)當(dāng)m>1時,設(shè)備部件處于磨損故障期(IFR型),由于設(shè)備老化而導(dǎo)致的故障率增長,應(yīng)增加檢修次數(shù),計算出未來年份發(fā)生的故障數(shù)量。根據(jù)故障數(shù)量做好備件儲備,同時加強季度檢修狀態(tài)檢測,對故障備件及時更換。
對于不同的機電設(shè)備,除預(yù)測設(shè)備使用年限外,通過大數(shù)據(jù)技術(shù)計算,還可以預(yù)測包括設(shè)備累計運行小時數(shù)、設(shè)備累計啟動次數(shù)、故障分類、剩余使用年限等設(shè)備可靠性相關(guān)指標(biāo)。
設(shè)備關(guān)聯(lián)分析又稱設(shè)備關(guān)聯(lián)挖掘,是在設(shè)備生產(chǎn)數(shù)據(jù)、運行數(shù)據(jù)等信息載體中,發(fā)現(xiàn)不同設(shè)備之間的聯(lián)系。各類設(shè)備故障之間可能存在不易發(fā)現(xiàn)的關(guān)系,在機電設(shè)備故障模型中,通過對各機電設(shè)備故障情況進行關(guān)聯(lián)分析,得到與故障情況相關(guān)聯(lián)的設(shè)備,結(jié)合實際分析與故障相關(guān)聯(lián)的原因。后續(xù)做設(shè)備分析時,可以根據(jù)這種關(guān)聯(lián),在設(shè)備發(fā)生故障時,關(guān)注所關(guān)聯(lián)設(shè)備的故障情況,提前做好預(yù)警工作。
設(shè)備關(guān)聯(lián)分析的核心算法是Apriori算法,該算法是一種挖掘關(guān)聯(lián)規(guī)則的頻繁項集的算法,其核心思想是通過2個階段挖掘頻繁項集,分別是候選集生成和封閉檢測階段,其中最小支持度和數(shù)據(jù)集是該算法的2個必要參數(shù)。通過采集綜合監(jiān)控設(shè)備的故障時間、設(shè)備故障時工作狀態(tài)等數(shù)據(jù),并根據(jù)該算法對設(shè)備數(shù)據(jù)進行分析,計算出2個或2個以上設(shè)備之間的故障關(guān)聯(lián)信息,從而對設(shè)備故障進行預(yù)警。
通過對同一車站多個時間粒度的綜合監(jiān)控歷史數(shù)據(jù)進行分析,可以得出不同設(shè)備之間發(fā)生故障的相互影響程度,發(fā)現(xiàn)各設(shè)備故障之間可能存在但不易發(fā)現(xiàn)的關(guān)系,從而對維修工作安排進行輔助指導(dǎo)。例如,對各站點的故障率進行分析,得出需要重點關(guān)注的站點以及與故障情況有關(guān)聯(lián)的設(shè)備。當(dāng)某設(shè)備類別發(fā)生故障時,與其關(guān)聯(lián)的類別也可能發(fā)生故障,此時需重點關(guān)注并提前預(yù)警。
當(dāng)前機電設(shè)備的安全報警方式主要有2種:①設(shè)備控制柜的儀表或報警燈報警;②現(xiàn)場的監(jiān)控系統(tǒng)報警。這2種方式目前均為基于閾值的報警,當(dāng)故障發(fā)生時,機電設(shè)備已經(jīng)發(fā)生故障造成停機或損失,無法提前預(yù)警。
為解決這類問題,在機電設(shè)備故障模型中,基于設(shè)備運行數(shù)據(jù),在設(shè)備運行過程中對數(shù)據(jù)做實時趨勢分析,在產(chǎn)生趨近設(shè)備閾值的時候提出預(yù)警,報告何種指標(biāo)將要超出閾值,并預(yù)測其將在多長時間后超出閾值,從而實現(xiàn)事前的趨勢預(yù)警,并為調(diào)整設(shè)備和解決故障提供足夠的時間,使設(shè)備運營過程更可控,提升維保效率。
故障趨勢預(yù)測的核心算法是指數(shù)平滑法,該方法是一種時間序列分析的預(yù)測手段,它是在移動平均法的基礎(chǔ)上衍生出來的,是通過計算指數(shù)平滑值,并與某個時間序列預(yù)測模型合作來預(yù)測該現(xiàn)象的未來。其原理主要是任意的平滑結(jié)果都是本期實際數(shù)據(jù)與前一期平滑數(shù)據(jù)加權(quán)計算的結(jié)果,其特點是,時間更近的數(shù)據(jù)具有更高的權(quán)重,以能夠使預(yù)測值迅速反應(yīng)當(dāng)前的市場情況。權(quán)重之間按等比級數(shù)減少,此級數(shù)之首項為平滑常數(shù)α,公比為(1 -α);指數(shù)平滑法對于觀測值給出的權(quán)重是靈活的,可以采用不同的值來更改權(quán)重的變化率,并調(diào)整時間序列中觀察值的一致性。
據(jù)業(yè)務(wù)場景不同,當(dāng)時間數(shù)列無明顯的趨勢變化時應(yīng)使用一次指數(shù)平滑法,當(dāng)時間序列呈線性規(guī)律時應(yīng)采用二次指數(shù)平滑法。
(1)一次指數(shù)平滑預(yù)測,其計算公式為:
(2)二次指數(shù)平滑是在一次指數(shù)平滑的結(jié)果基礎(chǔ)上再次平滑。根據(jù)機電設(shè)備運行特點,利用該方法對其進行故障預(yù)測較為合適。其計算公式為:
預(yù)測未來T期的預(yù)測值公式為:
(3)三次指數(shù)平滑預(yù)測,是二次平滑基礎(chǔ)上的再平滑,其計算公式為:
預(yù)測未來T期的預(yù)測值公式為:
指數(shù)平滑的預(yù)測結(jié)果為舊數(shù)據(jù)與新數(shù)據(jù)的加權(quán)和,所以為應(yīng)對實時變化,應(yīng)對不同的數(shù)據(jù)給予不同的權(quán)。新數(shù)據(jù)給與較大的權(quán),舊數(shù)據(jù)給與較小的權(quán)。
在指數(shù)平滑法中,預(yù)測是否準(zhǔn)確的關(guān)鍵是α值的選擇,α值決定了新數(shù)據(jù)與舊數(shù)據(jù)在預(yù)測中所占比例。α值越大,新數(shù)據(jù)所占的比重就越大,原預(yù)測值所占比重就越小,反之亦然。當(dāng)時間序列呈穩(wěn)定的水平趨勢時,α應(yīng)取較小值;當(dāng)時間序列波動較大,長期趨勢變化的幅度較大時,α應(yīng)取中間值;當(dāng)時間序列具有明顯的上升或下降趨勢時,α應(yīng)取較大值。
隨著大數(shù)據(jù)技術(shù)的普及,傳統(tǒng)的設(shè)備維修、維護模式將逐步被智能維修所取代,通過對設(shè)備狀態(tài)的實時監(jiān)測與分析,能夠提前預(yù)測并發(fā)現(xiàn)設(shè)備故障以實現(xiàn)提前準(zhǔn)備并預(yù)警,最大程度減少因設(shè)備故障所產(chǎn)生的損失。同時,實時監(jiān)控故障狀態(tài)也可以減少人工巡檢的工作任務(wù),提高工作效率。青島地鐵集團有限公司作為國內(nèi)首個基于大數(shù)據(jù)技術(shù)搭建線網(wǎng)中心的地鐵公司,建立了設(shè)備故障監(jiān)測與智能診斷系統(tǒng),為對易損機械部件及關(guān)鍵設(shè)備進行實時智能故障診斷,對設(shè)備故障狀態(tài)進行提前預(yù)測、預(yù)警,制定預(yù)測性檢修方案和輔助人工決策,以及后續(xù)的機電設(shè)備智能運維提供了可靠依據(jù)。