李 波,張炳森,張 寧
(1.中鐵第四勘察設(shè)計院集團(tuán)有限公司,武漢 430063;2.北京城建設(shè)計發(fā)展集團(tuán)股份有限公司,北京 100037;3.東南大學(xué)智能運輸系統(tǒng)研究中心軌道交通研究所,南京 210018)
現(xiàn)如今大客流已成為軌道交通的常見現(xiàn)象,這造成軌道交通的高強(qiáng)度運行,增加設(shè)備的使用時間,使得設(shè)備單元發(fā)生失效或故障的頻率增高。自動售檢票系統(tǒng)(Automatic Fare Collection, AFC)是軌道交通中不可缺少的系統(tǒng),該設(shè)備直接服務(wù)于乘客,其狀態(tài)的好壞直接影響著城市軌道交通的服務(wù)水平。盡管單從1臺設(shè)備、1個車站來看,設(shè)備的可靠性較高,故障率很低,但對于形成網(wǎng)絡(luò)的城市軌道交通系統(tǒng)來說,小概率的故障事件在形成工程規(guī)模后其影響比較突出[1]。
目前AFC設(shè)備檢修策略主要有故障維修和定期維修[2],故障維修可以使設(shè)備的有效壽命達(dá)到最大化,但維修不及時,設(shè)備可靠性低;定期維修關(guān)鍵在于如何確定合適的維修周期,周期過長將導(dǎo)致維修不足,過短將導(dǎo)致維修過?!,F(xiàn)有設(shè)備維修策略的優(yōu)化措施主要在于管理模式、管理條例、人員技能[3],這種基于固定維修模式的維修策略已愈加難以滿足當(dāng)下線網(wǎng)運營管理的實際需求。對于目前維修策略的不足,基于狀態(tài)的維修策略因其能夠綜合考慮安全和資源有效利用,受到國內(nèi)許多地鐵運營企業(yè)的關(guān)注。而設(shè)備無故障運行時間作為可靠性狀態(tài)的一個關(guān)鍵指標(biāo),可以為基于狀態(tài)的維修策略提供重要的決策依據(jù)。
因此,本論文提出一種基于生存分析的設(shè)備無故障運行時間預(yù)測方法,首先對AFC終端設(shè)備故障機(jī)理進(jìn)行分析,再對設(shè)備無故障運行時間進(jìn)行預(yù)測,得出設(shè)備的可靠性,并以自動檢票機(jī)為例,為維修管理提供新的思路。
AFC終端設(shè)備包括自動售票機(jī)、自動檢票機(jī)、半自動檢票機(jī)等,其中自動檢票機(jī)主要由主控單元、通道阻擋裝置、乘客顯示器、票卡回收裝置等組成,由于其結(jié)構(gòu)非常復(fù)雜,故障形式多樣,對設(shè)備的故障分類、故障影響因素進(jìn)行分析是進(jìn)行無故障預(yù)測的必要前提。
故障率曲線反映設(shè)備發(fā)生故障的內(nèi)在機(jī)理和規(guī)律[4]。經(jīng)過統(tǒng)計分析發(fā)現(xiàn),大多機(jī)械部件的故障率曲線類似浴盆形狀的曲線,稱為浴盆曲線,如圖1所示,設(shè)備經(jīng)歷早期故障、偶發(fā)故障期和耗損故障期3個階段。
圖1 設(shè)備故障浴盆曲線Fig.1 Bathtub curve of equipment failure
除浴盆曲線外,一些電子類元器件及復(fù)雜設(shè)備在實際運用中,故障規(guī)律往往是以下一種或幾種的組合[5],如圖2所示。
從定性分析中可以看出,故障率與設(shè)備部件材質(zhì)有很大關(guān)系,所以在進(jìn)行自動檢票機(jī)無故障運行時間預(yù)測之前,首先從故障屬性上將設(shè)備故障分為機(jī)械類故障和電氣類故障。
除AFC終端設(shè)備自身結(jié)構(gòu)設(shè)計缺陷因素之外,導(dǎo)致設(shè)備故障的影響因素還涉及多個方面,如客流因素、乘客行為、使用環(huán)境、維保水平等,以下結(jié)合實際故障數(shù)據(jù)對設(shè)備無故障運行時間的影響因素進(jìn)行分析。
圖2 現(xiàn)代設(shè)備5種故障率曲線Fig.2 Five failure rate curves of modern equipment
1)人員特征影響因素分析
人員對設(shè)備安全的影響至關(guān)重要,影響設(shè)備安全的人員分為內(nèi)部人員和外部人員。內(nèi)部人員指維修人員,維修人員的技術(shù)水平和責(zé)任心直接影響到維修徹底程度,技術(shù)水平高、責(zé)任心強(qiáng)的維修人員,可以使設(shè)備的可靠性達(dá)到或接近初始水平,大大提高設(shè)備的無故障運行時間,反之則降低設(shè)備的使用壽命。外部人員主要是指乘客,乘客的正常使用會造成設(shè)備磨損,高強(qiáng)度客流及乘客的違規(guī)操作會加速設(shè)備故障。
2)環(huán)境特征影響因素分析
環(huán)境是設(shè)備故障的重要影響因素之一,既包含外部大環(huán)境,例如降雨、地震、大風(fēng)等自然災(zāi)害,又包含內(nèi)部小環(huán)境,即設(shè)備的位置、運行溫度、濕度、灰塵等。不同季節(jié)時設(shè)備的故障次數(shù)如圖3所示,可以看出設(shè)備故障與季節(jié)因素有較強(qiáng)的相關(guān)性。
3)設(shè)備自身狀況特征影響因素分析
設(shè)備自身質(zhì)量的好壞也是影響設(shè)備故障的一個重要因素,設(shè)備自身的不良設(shè)計、安全裝置的缺陷以及非正常狀態(tài)運行等都直接或間接降低設(shè)備的使用壽命。設(shè)備無故障運行時間與故障次數(shù)的關(guān)系如圖4所示,可以看出隨著故障次數(shù)的累積,設(shè)備無故障運行時間呈現(xiàn)降低的趨勢。
圖3 不同季節(jié)設(shè)備發(fā)生的故障數(shù)Fig.3 Number of equipment failures in different seasons
圖4 設(shè)備無故障時間與故障次數(shù)的關(guān)系Fig.4 Relation between equipment fault-free time and failure times
綜上分析,設(shè)備的故障受到客流、環(huán)境及自身狀況等影響,在進(jìn)行故障預(yù)測時,需將這些特征影響因素考慮在內(nèi),并進(jìn)行量化,起到準(zhǔn)確預(yù)測的效果。
生存分析是一種對持續(xù)時間進(jìn)行分析的統(tǒng)計技術(shù),也稱為風(fēng)險模型,不僅能夠探索持續(xù)時間的分布模式,量化相關(guān)因素對持續(xù)時間的影響[6],還可以預(yù)測一個事件未來某個時間點終止的概率。此外,在模型的訓(xùn)練速度和準(zhǔn)確性方面,生存分析也具有良好的性能[7],因此本文選擇生存分析用來研究設(shè)備無故障運行時間。
生存分析通過建立風(fēng)險函數(shù)來研究無故障運行時間的分布規(guī)律。風(fēng)險函數(shù)可以表示設(shè)備在進(jìn)行無故障運行時間t的情況下,設(shè)備將在下一個極短時間段[t,t+△t]內(nèi)結(jié)束的概率。風(fēng)險函數(shù)具體變換過程如下。
對于一個隨機(jī)時間變量T,其累計分布函數(shù)可以表示為:
公式(1)中,F(xiàn)(t)表示持續(xù)時間T小于無故障運行時間t的概率,S(t)為生存函數(shù),表示設(shè)備無故障運行時間超出t的概率,也稱為生存率;f(t)為概率密度函數(shù),表達(dá)式為:
概率密度函數(shù)給出設(shè)備在時間[t,t+Δt]內(nèi)結(jié)束的瞬時概率。根據(jù)風(fēng)險函數(shù)的定義,可以得到風(fēng)險函數(shù)的表達(dá)式h(t)為:
生存分析函數(shù)的關(guān)系如圖5所示,在F(t)、f(t)、S(t)和h(t) 4個函數(shù)中已知任何一個,則可以推導(dǎo)得出其他3個函數(shù)。
圖5 生存分析模型函數(shù)Fig.5 Survival analysis model function
軌道交通設(shè)備故障具有非線性及非確定性的特點,無故障運行時間受到多種自然因素和人為因素的影響。在生存分析中,比例風(fēng)險(Proportion Hazards, PH)模型和加速失效時間(Accelerated Failure Time, AFT)模型是常用的多因素分析方法,前者是半?yún)?shù)估計方法,后者是參數(shù)估計方法,參數(shù)模型比半?yún)?shù)模型更為精確,且對結(jié)果的解釋更加簡單直觀[8]。所以選取AFT模型對設(shè)備無故障運行時間進(jìn)行預(yù)測。
AFT模型將線性回歸模型的建模方法引入到生存分析領(lǐng)域,協(xié)變量是通過與時間變量的乘積引起持續(xù)時間變化,其條件風(fēng)險函數(shù)和生存函數(shù)的具體表達(dá)形式為:
公式(4)、(5)中,ψ=EXP(-β'X)表示一組協(xié)變量向量,β’表示與協(xié)變量對應(yīng)的一組估計參數(shù)向量的轉(zhuǎn)置,β’X=β0+β1x1+…βnxn,h0(·)、S0(·)分別表示在所有協(xié)變量為零(X=0)時的基準(zhǔn)風(fēng)險函數(shù)和基準(zhǔn)生存函數(shù)。在生存分析中,預(yù)測值一般取累積生存率曲線上的中位值,即設(shè)備故障間隔時間位于預(yù)測值兩側(cè)的概率都是50%。根據(jù)中位值預(yù)測方法,設(shè)備在經(jīng)歷時間T條件下的無故障時間預(yù)測值可以表示為:
公式(6)中,tMedian│T表示無故障時間的條件預(yù)測值,是在時間T條件下累積生存率所對應(yīng)的時間坐標(biāo)值的一半。
參數(shù)模型具有多種具體的形式(如不同的概率分布函數(shù)、變量選擇),需要對各種模型的擬合優(yōu)度進(jìn)行比較。選取赤池信息量準(zhǔn)則(Akaike’s Information Criterion, AIC)作為評價準(zhǔn)則[9],它基于熵的概念提出,可用來權(quán)衡模型擬合數(shù)據(jù)的優(yōu)良性,是一種準(zhǔn)確有效的評價方法,其表達(dá)式為:
公式(7)中,L是模型的最大自然函數(shù)值,n是模型中所有參數(shù)的數(shù)目,包括協(xié)變量系數(shù)和模型分布系數(shù),赤池信息量準(zhǔn)則表明,AIC的值越小,模型越優(yōu)。
本文選取南京地鐵2號線油坊橋車站的自動檢票機(jī)為研究對象,油坊橋車站設(shè)立16臺自動檢票機(jī),并選取2016年全年的自動檢票機(jī)設(shè)備故障記錄數(shù)據(jù)作為設(shè)備無故障運行時間預(yù)測的原始數(shù)據(jù)集。
首先對故障數(shù)據(jù)進(jìn)行規(guī)格化處理,在記錄的全年故障數(shù)據(jù)中,對同一種偶然故障在24 h內(nèi)累計達(dá)3次記為一次關(guān)聯(lián)性故障;對由于未真正修復(fù)而又再次出現(xiàn)的故障,和原來的故障合并,記為同一次故障;故障修復(fù)后累計工作不足24 h,再次發(fā)生同一故障時,只記錄一次故障。經(jīng)過數(shù)據(jù)處理,共得到730條故障數(shù)據(jù),其中機(jī)械類故障388條,電子類故障342條。選取編號1至12號設(shè)備的故障數(shù)據(jù)作為訓(xùn)練無故障運行時間預(yù)測的原始數(shù)據(jù)集,13至16號設(shè)備的故障數(shù)據(jù)集對模型進(jìn)行性能評價,并以機(jī)械類故障為例進(jìn)行建模分析。
建模過程中需要的環(huán)境特征影響因素和設(shè)備狀態(tài)特征影響因素,通過系統(tǒng)和人工記錄獲得??土魈卣?、設(shè)備狀況特征及環(huán)境特征三方面與設(shè)備無故障運行時間相關(guān)的影響因素,為模型變量的選取和賦值提供有利的參考依據(jù)。通過量化這3類特征因素得到預(yù)測模型的潛在協(xié)變量如表1所示。
表1 潛在協(xié)變量及賦值說明Tab.1 Description of potential covariates and assignments
1)模型分布函數(shù)選擇
對機(jī)械故障數(shù)據(jù)集分別使用Loglogistic、Weibull、Logistic、Lognormal、Normal 5 種 常用的生存分析分布函數(shù)依次進(jìn)行回歸分析,得到各自的AIC值如表2所示。根據(jù)AIC值越小越好的原則,選取Weibull為基準(zhǔn)分布構(gòu)建加速失效模型。
表2 各分布的AIC對比Tab.2 AIC comparison of each distribution
2)模型參數(shù)估計
采用逐步回歸法對模型的輸入變量進(jìn)行選擇。一般常用0.05作為顯著性水平的臨界值,但考慮到模型要能夠反映更全面的信息,在本文中認(rèn)為在不大于0.1時仍然是有效的。通過回歸分析剔除干擾模型的變量,可以得到無故障運行時間預(yù)測模型的協(xié)變量選擇及參數(shù)估計結(jié)果如表3所示。
表3 變量選擇及參數(shù)估計表Tab.3 Variable selection and parameter estimation table
根據(jù)數(shù)理統(tǒng)計原理,Weibull分布的概率密度函數(shù)為:
公式(8)中,λ,p分別為Weibull分布的尺寸參數(shù)和形狀參數(shù),可以推導(dǎo)出Weibull分布的風(fēng)險函數(shù)及生存函數(shù)表達(dá)式分別為:
根據(jù)表3模型參數(shù)的估計結(jié)果,就可以得到設(shè)備無故障運行時間的風(fēng)險函數(shù)、生存函數(shù)以及在經(jīng)歷時間T的條件下設(shè)備無故障運行時間預(yù)測值的表達(dá)式為:
為了更直觀的看出設(shè)備無故障運行時間的生存規(guī)律,在設(shè)備無故障運行時間預(yù)測模型中(訓(xùn)練數(shù)據(jù)集的平均值)時的生存函數(shù)和風(fēng)險函數(shù)如圖6所示,可以看出設(shè)備無故障運行時間的風(fēng)險率是單調(diào)遞增的,其增長速度由緩到快,生存率曲線與風(fēng)險率曲線大致呈現(xiàn)一種對稱的關(guān)系,隨著時間的運行,設(shè)備的生存率下降,當(dāng)運行一定時間段時,設(shè)備生存率低于一定程度,說明極有可能發(fā)生故障。
圖6 基于Weibull-AFT模型的生存函數(shù)和風(fēng)險函數(shù)Fig.6 Survival function and risk function based on Weibull-Aft model
根據(jù)公式(13),對于無故障運行時間預(yù)測模型,在T=0條件下,預(yù)測值t為設(shè)備無故障運行時間預(yù)測值,選取平均絕對百分比誤差(MAPE)作為模型準(zhǔn)確性的評價指標(biāo),表達(dá)式為:
公式(14)中,n為樣本個數(shù);Xi為實際觀測值;為預(yù)測值。
為了進(jìn)一步驗證該模型的預(yù)測性能,基于同樣的機(jī)械類故障數(shù)據(jù),在故障影響因素標(biāo)準(zhǔn)化處理的基礎(chǔ)上,建立多元線性回歸模型,進(jìn)而對設(shè)備無故障運行時間進(jìn)行預(yù)測,在MAPE的評價指標(biāo)下,對比兩種模型的預(yù)測性能。
MAPE的值越小,表明預(yù)測模型具有更好的準(zhǔn)確性。MAPE的各種取值范圍與其所表示模型準(zhǔn)確程度的對應(yīng)關(guān)系如表4所示[10]。
表4 MAPE值對應(yīng)的預(yù)測準(zhǔn)確性程度Tab.4 Accuracy degree of prediction corresponding to MAPE value
基于生存分析和基于回歸分析的設(shè)備無故障運行時間預(yù)測的MAPE值分別為7.42%、12.75%,表明基于生存分析的預(yù)測模型具有非常準(zhǔn)確的預(yù)測性能。盡管基于回歸分析的預(yù)測模型也具有良好的預(yù)測性能,但基于生存分析的預(yù)測模型預(yù)測性能明顯更優(yōu),能夠更有效的反映設(shè)備的故障規(guī)律,為維修策略提供更準(zhǔn)確的參考。
自動檢票機(jī)設(shè)備是一個涉及到多專業(yè)的復(fù)雜設(shè)備,現(xiàn)在的維修管理策略存在資源浪費等缺點,引入基于狀態(tài)的策略是實現(xiàn)科學(xué)合理維修的良好手段。本文提出的基于風(fēng)險的設(shè)備無故障運行時間預(yù)測方法,不僅實現(xiàn)了對設(shè)備使用壽命的準(zhǔn)確預(yù)測,也體現(xiàn)出設(shè)備在生命周期過程中出現(xiàn)故障的可能性。采用南京地鐵油坊橋車站設(shè)備故障數(shù)據(jù)對方法進(jìn)行估計和驗證,并與基于回歸分析的方法進(jìn)行比較,結(jié)果顯示該模型具有非常準(zhǔn)確的預(yù)測性能,表明該方法具有較好的實用價值。