李亞群,包云,韓霈然,楊建偉,陳中雷
(1.北京經(jīng)緯信息技術有限公司,北京 100081;2.中國鐵道科學研究院集團有限公司 電子計算技術研究所,北京 100081;3.北京交通大學 交通運輸學院,北京 100044;4.中國鐵路北京局集團有限公司 工務部,北京 100860)
高速鐵路災害監(jiān)測系統(tǒng)(簡稱:災害監(jiān)測系統(tǒng))實時監(jiān)測鐵路沿線風、雪、雨等自然災害及異物侵限,當監(jiān)測值超過報警預警閾值時進行報警和預警,發(fā)生異物侵限和地震報警時,進行緊急處置,保障列車運行安全[1-2]。災害監(jiān)測系統(tǒng)為高速列車在災害性天氣和突發(fā)事件下的運行發(fā)揮了重要的安全技術保障作用。災害監(jiān)測系統(tǒng)由現(xiàn)場監(jiān)測設備和中心系統(tǒng)組成,現(xiàn)場監(jiān)測設備包括風速風向計、雨量計、雪深計、數(shù)據(jù)傳輸單元等現(xiàn)場采集設備和監(jiān)控單元,部署于鐵路沿線接觸網(wǎng)桿、基站等處所;中心系統(tǒng)包括信息處理平臺、監(jiān)測業(yè)務終端、網(wǎng)絡設備、網(wǎng)絡安全設備,時間同步設備及其軟件等,部署于鐵路局機房。災害監(jiān)測系統(tǒng)構成復雜,任何一個環(huán)節(jié)均可能導致系統(tǒng)故障的產(chǎn)生。
目前,已開展的高速鐵路災害監(jiān)測故障、可靠性分析工作中,張翠兵[3]運用故障樹分析法對異物侵限監(jiān)測子系統(tǒng)故障進行了分析;周紹華[4]重點對異物侵限監(jiān)測子系統(tǒng)產(chǎn)生紅光帶故障處置措施進行了研究;劉巖、李曉宇等人[5-6]對災害監(jiān)測系統(tǒng)可靠性進行了研究;王嬌嬌等人[7]對災害監(jiān)測系統(tǒng)脫離監(jiān)控故障數(shù)據(jù)進行了分析,并提出了改進措施與建議;周小明[8]對滬寧城際災害監(jiān)測系統(tǒng)電源故障進行了分析;李亞群等人[9-10]對監(jiān)控單元設備可靠性進行了試驗研究,并建立了時齊泊松過程模型對異物侵限監(jiān)測系統(tǒng)可靠性進行了試驗。以上研究多是對災害監(jiān)測系統(tǒng)故障、可靠性的分析,而關于災害監(jiān)測系統(tǒng)故障診斷方法的研究尚不多見。開展災害監(jiān)測系統(tǒng)故障診斷方法研究,可及時解決災害監(jiān)測系統(tǒng)出現(xiàn)的問題,降低故障影響程度。目前,常用的故障診斷方法有回歸分析、神經(jīng)網(wǎng)絡、支持向量機、隨機森林等算法[11-13],本文結合災害監(jiān)測系統(tǒng)設備狀態(tài)及故障監(jiān)測數(shù)據(jù)特點,采用隨機森林算法對災害監(jiān)測系統(tǒng)進行故障診斷,輔助故障快速定位和處置。
災害監(jiān)測系統(tǒng)是一個復雜的系統(tǒng),設備管理涉及多個專業(yè),包括工務、電務、信息等;設備類型多、環(huán)節(jié)多、管理部門多,一旦發(fā)生故障,排查困難,各部門協(xié)調(diào)工作量大,嚴重時會影響線路正常運行。災害監(jiān)測系統(tǒng)設備管理分工,如圖1 所示。
圖1 高速鐵路災害監(jiān)測系統(tǒng)設備管理分工
(1)信息專業(yè)設備有鐵路局集團公司中心系統(tǒng)軟/硬件設備,包括信息處理平臺、監(jiān)測業(yè)務終端、網(wǎng)絡設備和網(wǎng)絡安全設備,時間同步設備等;
(2)信號專業(yè)設備有監(jiān)控單元至信號機房之間的電纜、電務段監(jiān)測維護終端及信號系統(tǒng)側的災害監(jiān)測系統(tǒng)接口設備;
(3)通信專業(yè)設備有監(jiān)控單元及配套網(wǎng)絡設備、現(xiàn)場采集設備至監(jiān)控單元之間的光纜或電纜、災害監(jiān)測系統(tǒng)專用配電箱、通信段監(jiān)測維護終端等;
(4)工務專業(yè)設備有現(xiàn)場采集設備、工務段監(jiān)測維護終端等;
(5)供電專業(yè)設備有監(jiān)控單元端子排(不含)至變電系統(tǒng)之間的設備。
目前,災害監(jiān)測系統(tǒng)對設備狀態(tài)監(jiān)測的數(shù)據(jù)是離散的,監(jiān)測設備是否正常工作一般采用0 或1 變量表示,因此,無法采用回歸分析方法開展對設備狀態(tài)的分析。本研究基于失效模式與影響分析(FMEA,F(xiàn)ailure Mode and Effects Analysis)對設備故障數(shù)據(jù)進行分析,在此基礎上,研究設備故障診斷的方法。根據(jù)對災害監(jiān)測系統(tǒng)故障的調(diào)研結果,構建了基于FMEA 的災害監(jiān)測系統(tǒng)故障分析表,故障分析表包含12 類設備,45 種故障原因。以監(jiān)控單元為例,基于FMEA 的監(jiān)控單元故障分析,如圖2 所示。
圖2 基于FMEA 的設備監(jiān)控單元故障分析
監(jiān)控單元故障分為嚴重故障和一般故障。嚴重故障會導致監(jiān)測點失效,需派人進行人工值守并安排天窗點維修,一般故障需等待天窗點維修。
本文采用隨機森林算法對災害監(jiān)測系統(tǒng)進行設備故障診斷。其原理為:采用Bootstrap 重抽樣方法[14]從原始樣本中抽取多個樣本,對每一個樣本建立分類和回歸樹(CART,Classification And Regression Tree)(統(tǒng)稱:決策樹),將這些決策樹進行整合,構成隨機森林模型?;陔S機森林算法的災害監(jiān)測系統(tǒng)故障診斷流程,如圖3 所示。
圖3 基于隨機森林算法的災害監(jiān)測系統(tǒng)故障診斷流程
(1)對災害監(jiān)測系統(tǒng)故障數(shù)據(jù)進行預處理,通過設備狀態(tài)、故障數(shù)據(jù)、故障表現(xiàn)和故障原因,結合故障分析表進行故障分析。其中,災害監(jiān)測系統(tǒng)故障原因是決策類別,故障現(xiàn)象是特征屬性。
(2)通過Bootstrap 重抽樣方法抽取災害監(jiān)測系統(tǒng)故障數(shù)據(jù)。采用訓練節(jié)點分裂規(guī)則對故障現(xiàn)象進行排序,得到各個節(jié)點的特征屬性;再根據(jù)特征屬性的不同值,從該節(jié)點向下分支,選擇最優(yōu)決策樹(分支)個數(shù),最終構成故障診斷隨機森林模型。
(3)采用構成的隨機森林模型對新的故障數(shù)據(jù)進行分類和診斷,得出故障原因,輔助設備管理部門快速定位故障。
本研究共收集到多條線路災害監(jiān)測系統(tǒng)故障樣本403 條,將所有數(shù)據(jù)的70% 作為訓練集,其余30%作為測試集,采用python 編程語言構建基于隨機森林算法的災害監(jiān)測系統(tǒng)故障診斷模型,同時,設計基于傳統(tǒng)決策樹(C4.5 決策樹)算法的災害監(jiān)測系統(tǒng)故障診斷模型,將其作為對比方案。診斷結果,如表1 所示。由表1 可知,基于隨機森林算法的故障診斷效果明顯優(yōu)于基于C4.5 決策樹算法的故障診斷效果,可減少人工排查設備故障的工作量,提高工作效率。
表1 故障綜合診斷結果
對災害監(jiān)測系統(tǒng)具體構成部分進行故障診斷,以監(jiān)控單元和風采集設備的故障診斷為例,獲得監(jiān)控單元樣本225 條,故障原因10 種,故障表現(xiàn)13 類;風采集設備樣本59 條,故障原因11 種,故障表現(xiàn)4 類。對監(jiān)控單元和風采集設備2 個數(shù)據(jù)集的分類器個數(shù)進行判斷,以監(jiān)控單元的數(shù)據(jù)為例,基于訓練集構建的決策樹個數(shù)與判斷準確率關系,如圖4 所示,可以看出,最優(yōu)決策樹棵數(shù)在10 以內(nèi)達到最優(yōu)的準確性,基于此,構建災害監(jiān)測系統(tǒng)故障診斷隨機森林模型。
圖4 監(jiān)控單元隨機森林決策樹個數(shù)與判斷準確率關系
對監(jiān)控單元和風采集設備的基于隨機森林算法和基于C4.5 決策樹算法的故障診斷方法分別進行k折交叉驗證,即將全部樣本劃分成k個大小相等的樣本子集,依次遍歷這k個子集,每次把當前子集作為驗證集,其余所有樣本作為訓練集,進行模型的評估,評估結果如圖5 所示,從圖5 中可以看出,隨機森林算法的表現(xiàn)明顯優(yōu)于C4.5 決策樹算法,診斷結果如表2 和表3 所示。
表2 監(jiān)控單元故障診斷結果
表3 風采集設備故障診斷結果
圖5 監(jiān)控單元和風采集設備故障診斷k 折交叉驗證結果
由表2、表3 可以看出,對災害監(jiān)測系統(tǒng)構成局部設備故障的診斷效果優(yōu)于對系統(tǒng)整體故障的診斷,原因在于災害監(jiān)測系統(tǒng)故障成因和現(xiàn)象復雜,一個故障現(xiàn)象可能由多種原因?qū)е拢鐬暮ΡO(jiān)測系統(tǒng)脫離監(jiān)控故障,可能是由網(wǎng)絡、硬件故障(電源、服務器、終端等)、軟件故障等多種原因?qū)е耓7];一個故障原因也可能出現(xiàn)多個故障現(xiàn)象,如風速風向計故障可能導致設備故障報警、監(jiān)測終端無采集數(shù)據(jù)等;而風采集設備的故障及故障原因相對系統(tǒng)整體故障成因和現(xiàn)象較簡單。
針對災害監(jiān)測系統(tǒng)故障診斷問題,構建了基于FMEA 的災害監(jiān)測系統(tǒng)故障分析表;在此基礎上,提出了基于隨機森林算法的災害監(jiān)測系統(tǒng)故障診斷方法。
(1)實際數(shù)據(jù)分析表明,基于隨機森林算法的災害監(jiān)測系統(tǒng)故障診斷方法對系統(tǒng)故障的診斷準確率為67.3%,優(yōu)于基于傳統(tǒng)決策樹的故障診斷準確率(48.5%);
(2)基于隨機森林算法的災害監(jiān)測系統(tǒng)故障診斷方法對監(jiān)控單元和風采集設備的診斷準確率為80.6%和86.7%,優(yōu)于基于傳統(tǒng)決策樹的故障診斷準確率(48.2%和66.4%);
(3)基于隨機森林算法的災害監(jiān)測系統(tǒng)故障診斷方法可有效提高災害監(jiān)測系統(tǒng)設備故障診斷準確率,有助于災害監(jiān)測系統(tǒng)設備故障的快速定位和處置,大幅減少人工排查設備故障的工作量,為災害監(jiān)測系統(tǒng)的運營維護提供技術支持。