朱文博, 王小敏
(西南交通大學 信息科學與技術學院, 四川 成都 611756)
無絕緣軌道電路是鐵路信號控制系統(tǒng)的關鍵設備,對保障列車安全運行起著至關重要的作用。鐵路區(qū)間較多使用ZPW-2000A無絕緣軌道電路,該系統(tǒng)設備工作環(huán)境惡劣,故障多發(fā),工作狀態(tài)直接關系到鐵路運輸?shù)男屎桶踩玔1]。目前主要采用定期檢修的方式排查軌道電路故障隱患,維修人員通過儀器測量相關監(jiān)測量,僅憑經(jīng)驗對設備進行故障診斷[2]。這種方法不僅勞動強度大、效率低,而且診斷效果受人為因素影響較大,有必要引入智能診斷方法輔助現(xiàn)場維修工作人員及時準確地判斷故障。
近年來,一些學者將各種智能技術引入軌道電路故障診斷中[3-11],在一定程度上取得了較好的效果。文獻[3]利用遺傳算法對補償電容故障和道砟電阻變化情況進行了診斷分析。文獻[4]用模糊神經(jīng)網(wǎng)絡方法對相敏軌道電路的4種典型故障進行有效的診斷。文獻[5]給出一種基于PSO參數(shù)優(yōu)化的SVM方法對軌道電路分路不良進行預測。由于軌道電路系統(tǒng)設備組成結構復雜,僅依靠單一網(wǎng)絡模型對系統(tǒng)進行故障診斷存在較大的局限性。文獻[6]提出一種數(shù)據(jù)驅動的網(wǎng)絡分解診斷方法,為軌道電路故障診斷提供了一種新思路。
一些智能方法僅能粗略地診斷出軌道電路的故障范圍,難以及時為維修人員提供有效的指導。為進一步指導維修,對軌道電路的多種細分故障模式進行有效診斷,本文結合C4.5算法[12]建立軌道電路組合決策樹診斷模型。該模型利用粗糙集屬性約簡為各級診斷子網(wǎng)絡選擇合適的特征屬性,再將C4.5融入各子網(wǎng)絡提取診斷規(guī)則,最終得到的規(guī)則具有清晰細化的特點。實驗仿真測試結果表明,該模型能夠對ZPW-2000A軌道電路多種故障模式進行有效診斷。
C4.5作為一種常用的決策樹分類算法,對文獻[13]提出的ID3算法進行了優(yōu)化改進,不僅能處理連續(xù)性數(shù)據(jù)分類問題,為不確定性數(shù)據(jù)[14]和非數(shù)值特征的模式識別問題也提供了有效的解決辦法。決策樹根據(jù)屬性值劃分節(jié)點,產(chǎn)生分支,以信息增益率作為選擇樹節(jié)點的指標,挖掘隱含于數(shù)據(jù)中的真實規(guī)則,分類規(guī)則對應根節(jié)點到葉節(jié)點的分支路徑,采用適當?shù)募糁Ψ椒╗15]可以簡化決策樹。
在訓練樣本集T中,每個樣本由n個條件屬性A共同決策某一類別Di(i=1,2,…,k)。同一類別的樣本個數(shù)記為|Di|,定義某類樣本的概率分布為Pi=|Di|/|T|,C4.5利用訓練集形成決策樹的步驟如下:
Step1計算訓練樣本初始熵為
( 1 )
Step2計算任一測試屬性A的信息熵為
( 2 )
Step3計算屬性A的信息增益為
G(A,T)=I(T)-I(A,T)
( 3 )
Step4依次推導屬性A的分割信息熵Split與信息增益率GR
( 4 )
( 5 )
Step5將信息增益率值最大的屬性選作當前節(jié)點,重復Step2~Step4依次選擇各級節(jié)點,直到葉節(jié)點只有同種類別。
智能分類技術應用到故障診斷中的主要任務是采用合適的特征選擇策略,提高診斷規(guī)則提取效率和分類準確率。對于決策系統(tǒng)中識別不同的目標類,往往會有不同的屬性組合方式構成決策表,為給定決策表構造深度盡量小的樹狀結構,需要簡化原始特征屬性集,消除冗余,改善分類性能。為此引入粗糙集[16]中屬性核(core)與相對約簡的概念,說明組合網(wǎng)絡模型的特征屬性選擇策略。
粗糙集中核是用來表示知識的最簡條件屬性集,核中任意屬性的缺失都會造成依賴性程度γC(D)變小。在保持依賴性程度γC(D)不變的前提下,屬性約簡過程不斷刪減冗余屬性,以獲得與識別決策類有關的最小條件屬性集為目的,具體算法描述如下。
決策表,C={ci|i=1,2,…,m}為條件屬性集,D={di|i=1,2,…,m}為決策屬性集,Rred?C設為初始約簡集,c∈C-Rred為任意屬性,給出如下定義。
γC(D)=POSC(D)/U
( 6 )
k(c,Rred,D)=γRred∪{c}(D)-γRred(D)
( 7 )
輸入:決策表S=;輸出:相對約簡集reduct。
Step1計算POSC(D),令coreC(D)=?;
Step2對于?ci∈C,若POSC-{ci}(D)≠POSC(D),則coreC(D)=coreC(D)∪{ci};
Step3令reduct=coreC(D),con=C-coreC(D),如果coreC(D)=?,則轉Step4,否則計算POSreduct(D),若POSreduct(D)=POSC(D),則終止,輸出約簡reduct;
Step5如果POSreduct(D)=POSC(D),則終止,輸出約簡reduct,否則轉Step4。
一般情況下某個決策系統(tǒng)的條件屬性集會有多種相對約簡組合,選擇相對約簡集reduct中任一組合,作為構造決策樹的特征屬性。
決策樹從根節(jié)點依次向下按照實例屬性值遍歷分支路徑,最終由樹的葉節(jié)點標記實例類別,形成的樹狀判別網(wǎng)絡結構清晰、準確率高且規(guī)則解釋性強。另一方面,組成無絕緣軌道電路系統(tǒng)的電氣設備較多,存在多種直接或間接故障組合因素導致的故障類型,將故障類型逐級劃分為多層決策子網(wǎng)構成組合決策診斷模型,使得診斷效果更具針對性。
ZPW-2000A軌道電路由位于室外、室內、送受端的各種電氣設備組成。區(qū)段紅光帶和分路不良為兩類常見的由電氣設備失效引發(fā)的故障現(xiàn)象,為準確細致地劃分故障,并盡量便于維護,本文歸納出表1所示的14種故障模式,其中TU1和TU2表示匹配調諧單元。
表1 軌道電路故障模式
基于3.2節(jié)劃分的故障模式,構建組合決策樹網(wǎng)絡模型,見圖1,在根節(jié)點處判斷系統(tǒng)狀態(tài),系統(tǒng)正常運行用“F0”表示,利用系統(tǒng)監(jiān)測信息結合專家經(jīng)驗[17],判斷系統(tǒng)異常則繼續(xù)向下遍歷分支直到辨別出具體故障模式。粗糙集屬性約簡分別為組合網(wǎng)絡中樹節(jié)點1~樹節(jié)點3-2-2選擇相應的特征屬性,再利用C4.5算法訓練各子網(wǎng)樣本產(chǎn)生具體診斷規(guī)則,F(xiàn)1~F14為表1中的故障模式。
圖1 軌道電路故障診斷的組合決策樹網(wǎng)絡
由于現(xiàn)場的軌道電路故障樣本難以獲取,本文利用實驗室軌道電路模擬仿真平臺設置各類故障,獲取足量樣本,該仿真平臺結構見圖2。
該實驗平臺除鋼軌線路部分用軌道模擬盤替代,其余設備與實際軌道電路所用設備一樣,電氣特性與實際軌道電路相似,不影響采集數(shù)據(jù)的可用性,軌道電路模擬仿真平臺相關參數(shù)見表2。
圖2 ZPW-2000A軌道電路結構
表2 軌道電路模擬仿真平臺相關參數(shù)
結合現(xiàn)場軌道電路各設備故障發(fā)生比例的實際情況,在軌道電路仿真平臺上模擬設置各種設備故障,采集各節(jié)點監(jiān)測量數(shù)據(jù)組成樣本集,其中訓練集由各種故障模式且不重復的樣本組成,測試樣本從剩余的樣本中隨機抽取,樣本集分布見表3。
將訓練樣本集隨機劃分成包含各種故障模式等數(shù)量的10份,訓練建模數(shù)據(jù)每次選取其中9份,余下1份數(shù)據(jù)用于模型檢驗,如此反復訓練和檢驗診斷模型的正確性。
表3 各類故障模式分布
通常,決策系統(tǒng)的條件屬性是能反映決策域分類信息的原始特征集C(c1,c2,...,cn),其每一分量ci都隱含了特定的分類信息,原始特征對于組合決策網(wǎng)絡各樹節(jié)點的待辨識類別存在不同的冗余情況,為各樹節(jié)點保留必要分類信息的前提下,采取特征選擇策略降低屬性冗余度,可以提高C4.5訓練效率和分類準確率。
本文以下列12種監(jiān)測量組成原始特征集:發(fā)送功出電壓M1、發(fā)送電流M2、電纜側發(fā)送電壓M3、主軌入電壓M4、發(fā)端TU1電流M5、發(fā)端SVA電流M6、發(fā)端TU2電流M7、受端TU1電流M8、受端SVA電流M9、受端TU2電流M10、電纜側接收電壓M11、主軌接收電壓M12。
根據(jù)各級C4.5決策子網(wǎng)的故障類別,利用屬性約簡算法從原始特征集中為各子網(wǎng)分別提取合適的特征向量組合,既可以提高訓練效率又使分類過程更具針對性,采用粗糙集屬性約簡算法計算得到圖1中各樹節(jié)點的特征屬性見表4,訓練得到各決策樹的平均深度為3層,其樹形結構的辨識效果較理想。
表4 各樹節(jié)點的特征屬性組成情況
以組合網(wǎng)絡的樹節(jié)點1為例,直接利用屬性約簡的計算結果,取3個模擬量M1、M3、M11作為決策子網(wǎng)的特征屬性,抽取部分故障數(shù)據(jù)見表5,由C4.5算法訓練得到樹節(jié)點1的診斷決策樹,見圖3。
表5 樹節(jié)點1的故障數(shù)據(jù)表 V
圖3 樹節(jié)點1的診斷決策樹
BP神經(jīng)網(wǎng)絡是一種廣泛應用于故障診斷領域的非線性系統(tǒng)辨識工具。一方面按照軌道電路5種粗粒度故障范圍的劃分模式,每種各選取若干組數(shù)據(jù)經(jīng)過歸一化處理構成訓練集,分別利用BP 神經(jīng)網(wǎng)絡和本文方法進行訓練建立診斷模型。采用newff函數(shù)創(chuàng)建BP神經(jīng)網(wǎng)絡,選擇trainlm函數(shù)進行訓練,輸入層以12個監(jiān)測模擬量作為節(jié)點,隱含層設置10個節(jié)點,輸出層由5個節(jié)點構成診斷結果向量(如線路故障(0,0,1,0,0)),設置BP神經(jīng)網(wǎng)絡最大訓練次數(shù)為1 000,期望誤差為0.000 1,學習率為0.05,訓練到第92次時達到期望誤差。利用測試數(shù)據(jù)對訓練好的BP神經(jīng)網(wǎng)絡模型和本文屬性約簡方法建立的單C4.5決策樹,進行準確率仿真測試,對比結果見表6,C4.5決策樹判斷準確率略高于BP神經(jīng)網(wǎng)絡法,達90.3%。軌道電路粗粒度故障范圍診斷系統(tǒng)的原始特征較多,BP神經(jīng)網(wǎng)絡訓練過程偏向擬合數(shù)據(jù)的輸入輸出關系,難以獲知特征屬性隱含的內部規(guī)則,測試過程中不可避免受冗余屬性的影響,導致分類效果欠佳。本文所述方法相比BP神經(jīng)網(wǎng)絡法的優(yōu)勢在于,有針對性地采取有效的特征提取策略去除冗余,提高了C4.5訓練的效率和準確率,且生成的樹狀規(guī)則清晰直觀。
表6 C4.5與BP神經(jīng)網(wǎng)絡測試準確率比較
另一方面利用訓練好的組合決策樹網(wǎng)絡模型逐級對14種細分故障模式進行識別,與單網(wǎng)絡C4.5模型的辨識效果做對比,得到兩種模型的正判率見表7。對比結果顯示,組合決策樹模型不僅第一級判別5種故障范圍時正判率高達98%,當判別細分的14類故障模式時,準確率也有較明顯上升。在實際應用中,通過安裝軌道電路室外設備信號采集裝置[18],結合信號集中監(jiān)測系統(tǒng)獲取室內外監(jiān)測信息,為本文方法提供所需故障樣本數(shù)據(jù),若能獲取較完整的監(jiān)測數(shù)據(jù)以便劃分多種故障模式,對提高診斷及維護效率具有重要意義。
表7 決策樹組合網(wǎng)絡模型樣例檢驗結果
注:如圖1網(wǎng)絡層級,其中一級為室內外故障范圍判斷,二級為送受端故障判斷,三級為具體故障模式判斷。
本文提出一種基于組合決策樹的無絕緣軌道電路故障診斷方法,利用粗糙集理論的屬性約簡原理為各子網(wǎng)C4.5決策樹提供有效的特征屬性選擇策略,能夠從大量樣本中自動學習生成規(guī)則,實現(xiàn)方法簡單,自適應能力強。根據(jù)軌道電路故障的逐級劃分,以C4.5決策樹作為組合網(wǎng)絡的基本組成單元,設計了具有針對性的故障判別網(wǎng)絡結構,從根本上改善分類器性能,分類效果遠優(yōu)于單決策樹網(wǎng)絡,克服了單決策樹處理屬性過多問題時難以收斂及樹結構復雜等缺點。模型檢驗結果表明,該組合決策樹網(wǎng)絡對ZPW-2000A型軌道電路故障診斷具有較高的準確率。