趙曉峰
(上海富欣智能交通控制有限公司,上海 201210)
基于WEKA的信號設備預測性維護信息系統(tǒng)
趙曉峰
(上海富欣智能交通控制有限公司,上海 201210)
信號設備預測性維護信息系統(tǒng)主要是對信號系統(tǒng)的各子系統(tǒng)維護信息進行數(shù)據(jù)挖掘,結合系統(tǒng)可靠性、可用性、可維護性分析結果,制定預測性維護策略,定義故障信息收集模板,提供基于自由軟件WEKA的預測性維護方法,使用軟件集成的開發(fā)方式,建立數(shù)據(jù)挖掘的分類、聚類、關聯(lián)模型。這種方式既有助于縮短開發(fā)周期,也能夠有效降低軟件成本。
預測性維護;自由軟件;數(shù)據(jù)挖掘;分類;聚類;關聯(lián)
預測性維護是以狀態(tài)為依據(jù)的維修,在設備運行時,對其主要部位進行狀態(tài)檢測和故障診斷,判定設備所處的狀態(tài),并能預測設備未來的狀態(tài)趨勢和可能的故障模式,從而制定出預測性維護計劃。
懷卡托知識分析環(huán)境(WEKA)是一款使用Java語言編寫的面向機器學習和數(shù)據(jù)挖掘的綜合工具平臺,獲得了GNU通用公共許可認證,為自由軟件,包含一系列可視化工具、數(shù)據(jù)分析算法以及建模技術,支持數(shù)據(jù)預處理、聚類、分類、回歸、可視化和特征選擇。
應用于城市軌道交通信號系統(tǒng)的預測性維護信息系統(tǒng)是在實時監(jiān)督和收集運營相關各子系統(tǒng)狀態(tài)和報警數(shù)據(jù)的基礎上,經過大量數(shù)據(jù)挖掘和知識分析,同時輔以資產管理和辦公自動化等工具,提供更準確的預防性維護計劃和建議,有助于降低和減少糾正性維護發(fā)生的概率和造成的危害,并為整個信號系統(tǒng)可靠性、可用性、可維護性(RAM)指標的驗證提供依據(jù)。
預測性維護信息系統(tǒng)數(shù)據(jù)收集的范圍包括計算機聯(lián)鎖(CI)、區(qū)域控制器(ZC)、車載控制器(VOBC)、列車自動監(jiān)控(ATS)、數(shù)據(jù)通信系統(tǒng)(DCS)的內部和外部數(shù)據(jù),以及列車位置檢測設備、道岔、信號機、有源信標、站臺屏蔽門、站臺緊急按鈕等軌旁外部設備的狀態(tài)和故障信息,車輛、速度計、加速度計、雷達傳感器、信標應答器、司機顯示器等車載外部設備的狀態(tài)和故障信息。
預測性維護信息系統(tǒng)經過數(shù)據(jù)挖掘和知識分析后,會生成糾正性維護和預防性維護的計劃。其中,糾正性維護需要維護人員在預測故障發(fā)生前盡快執(zhí)行;預防性維護主要包括軌旁和車載設備的日檢、周檢、雙周檢、月檢、季檢、半年檢、年檢具體內容的增加或更新。
根據(jù)EN50126標準要求,城市軌道交通信號系統(tǒng)應進行RAM評估,提交RAM分析報告和定量安全風險分析報告(QRA),尤其是計算機聯(lián)鎖、區(qū)域控制器、車載控制器等SIL4的子系統(tǒng)。表1給出了主要信號設備的RAM參考值。
表1 信號設備RAM參考值
預測性維護信息系統(tǒng)主要由數(shù)據(jù)采集、數(shù)據(jù)清洗和數(shù)據(jù)應用3大功能模塊構成,如圖1所示。
圖1 預測性維護信息系統(tǒng)架構
數(shù)據(jù)采集模塊是對信號系統(tǒng)主要子系統(tǒng)的狀態(tài)和報警進行收集,包括ATS、DCS、計算機聯(lián)鎖、區(qū)域控制器、車載控制器、微機監(jiān)測等,不同子系統(tǒng)的數(shù)據(jù)格式可能不同;數(shù)據(jù)清洗模塊是對不同格式的數(shù)據(jù)源進行格式化,檢查數(shù)據(jù)一致性,處理無效值、缺失值和重復值,并存入預測性維護數(shù)據(jù)庫;數(shù)據(jù)應用是以維護數(shù)據(jù)庫為核心,根據(jù)故障處理方式的不同,分為3類:(1)基于故障定位的維修工單子模塊,主要輔助解決糾正性維護任務;(2)基于故障統(tǒng)計的RAM管理子模塊,實現(xiàn)長期數(shù)據(jù)的分析,為軌道交通維護和建設指標提供參考;(3)基于故障預測的維修計劃子模塊,主要輔助持續(xù)更新預防性維護任務,并圍繞系統(tǒng)外的維修因素—人員和備件進行綜合管理。
城市軌道交通運營單位一般會在信號系統(tǒng)開通后增設維護支持系統(tǒng),主要是完成對軌旁信號設備的微機監(jiān)測和機房環(huán)境監(jiān)測,所以在構建預測性維護信息系統(tǒng)時,應支持獨立工作和軟件集成兩種運行模式。WEKA的Simple CLI和Knowledge Flow功能環(huán)境可以很好地實現(xiàn)這兩種方式。其中,Simple CLI提供一個簡單的命令行界面,可以把模型保存下來,這樣有新的待預測數(shù)據(jù)出現(xiàn)時,不用每次重新建模,直接應用保存好的模型即可。此外,對預測結果給出置信度,用戶可以有選擇地采納預測結果。Knowledge Flow環(huán)境提供數(shù)據(jù)的預處理,數(shù)據(jù)格式的轉化,各種數(shù)據(jù)挖掘算法,并提供結果的可視化工具,還可以讓用戶創(chuàng)建、運行、修改和分析算法試驗,比單獨分析各個算法更加方便。
下面從數(shù)據(jù)挖掘不同模型的角度詳細描述預測性維護信息系統(tǒng)核心功能的實現(xiàn)。
3.1 分類模型
分類是通過分析訓練集中的數(shù)據(jù),為每個類別建立分類模型,并用該模型對數(shù)據(jù)庫中的其他記錄進行分類。常用分類算法有貝葉斯(Bayes)、決策樹(Decision Tree)等。
如圖2所示,左側是各個子系統(tǒng)的維護數(shù)據(jù),CBI、ZC、VOBC主要是從診斷維護端口送出的內部狀態(tài)和報警,以及各自嵌入式子系統(tǒng)的運行日志;計軸(Axle Counter)主要是內部串口版和并口版的工作狀態(tài)信息;ATS主要有數(shù)據(jù)庫Data Logger存儲的信息,以及計劃和實際時刻表;DCS主要有數(shù)據(jù)記錄器(Data Recorder)抓取的網絡通信數(shù)據(jù)包,以及各交換機和防火墻的運行日志。經過數(shù)據(jù)預處理后,通過類指定器(Class Assigner)標明決定分類的屬性,再使用交叉驗證模塊(Cross Validation Fold Maker)分配訓練集和測試集,然后就可以對數(shù)據(jù)集進行貝葉斯網絡(Bayes Net)分類器分析。處理結果通過圖形查看器Graph Viewer圖形化顯示到用戶前端,并在通過分類行為評估器(Classifier Performance Evaluator)評估合格后,轉存儲到預測性維護數(shù)據(jù)庫,同時提供XML擴展接口,便于大數(shù)據(jù)的二次開發(fā)。
信號系統(tǒng)維護信息的分類主要是依據(jù)故障發(fā)生時間、地點、子系統(tǒng)等進行處理,同時考慮系統(tǒng)外部和內部的接口特性,并在大量數(shù)據(jù)積累基礎上對故障等級進行細致處理。因此,當發(fā)生故障時,須全面記錄從故障發(fā)生時刻到設備恢復正常時刻之間的各項信息,以便后續(xù)利用預測性維護信息系統(tǒng)進行分析和總結。表2列舉了信號設備故障信息收集模板,其中,每一個數(shù)據(jù)維度都可以按照不同的分析需要成為數(shù)據(jù)分類的依據(jù)。
圖2 信號設備維護信息分類模型
表2 信號設備故障信息收集模板
3.2 聚類模型
聚類是數(shù)據(jù)挖掘中用來發(fā)現(xiàn)數(shù)據(jù)分析和隱含模式的一項重要技術,其目的是把大量數(shù)據(jù)點的集合分成若干類,使得每個類中的數(shù)據(jù)之間最大程度地相似,而不同類中的數(shù)據(jù)最大程度地不同。常用聚類算法有K方法(K-means)、基于密度含噪聲的空間聚類應用算法(DBSCAN)、基于斜面的聚類算法(CLOPE)等。
如圖3所示,聚類模型的分析對象主要是經過數(shù)據(jù)清洗的預測性維護數(shù)據(jù)庫,通過訓練集生成器(Training Set Maker)的學習,就可以正式使用DBSCAN算法建立預測模型,該算法是基于密度的聚類算法,從數(shù)據(jù)對象的分布密度出發(fā),將密度足夠大的相鄰區(qū)域連接起來,從而發(fā)現(xiàn)具有任意形狀的聚類,并能有效處理異常數(shù)據(jù)。處理結果通過文本查看器(Text Viewer)以表格形式顯示給用戶。
圖3 信號設備維護信息聚類模型
DBSCAN算法主要用于分析通信故障的相關數(shù)據(jù)。信號系統(tǒng)中影響行車的通信故障主要有兩類:車地無線信號不穩(wěn)定和定位信標讀取失敗。城市軌道交通領域中目前大量使用符合IEEE 802.11標準的2.4 GHz無線通信,由于是ISM公共頻段,在傳輸信道中存在很多干擾源。經過大量分析發(fā)現(xiàn),無線信號在地下段主要受隧道參數(shù)影響,如:曲率半徑、豎曲線半徑等;而在地面和高架段主要受外來環(huán)境的干擾,如:繁華地段的商用WIFI信號、雷暴日、太陽風等。信標系統(tǒng)是基于RFID技術的列車絕對定位系統(tǒng),主要有歐標和美標兩種制式,通信頻段分別是27 MHz和902 MHz。根據(jù)現(xiàn)場運行數(shù)據(jù)分析,信標讀取失敗故障主要與產品批次和工作環(huán)境相關,如:金屬異物遮擋信標、道岔區(qū)域正線和側線信標安裝位置過近等。
3.3 關聯(lián)模型
關聯(lián)規(guī)則是當前數(shù)據(jù)挖掘研究的主要方法之一,它反映一個事物與其他事物之間的相互依存性和關聯(lián)性。如果兩個或者多個事物之間存在一定的關聯(lián)關系,那么其中一個事物就能夠通過其他事物預測到。常用關聯(lián)規(guī)則算法有挖掘關聯(lián)規(guī)則的頻繁項集算法(Apriori)、頻繁項增長算法(FPGrowth)、Tertius等。
如圖4所示,關聯(lián)模型的分析對象主要是經過數(shù)據(jù)清洗的預測性維護數(shù)據(jù)庫,通過訓練集生成器(Training Set Maker)的學習后,就可以正式使用Predictive Apriori算法建立預測模型,該算法基于Apriori算法,其步驟是:(1)通過迭代,檢索出數(shù)據(jù)庫中的所有頻繁項集,即支持度不低于用戶設定的閾值的項集,利用頻繁項集構造出滿足用戶最小信任度的規(guī)則。(2)通過不斷增大規(guī)則前項支持度和觀察置信度來逐步逼近獲得最大預測精度,從而返回最好的關聯(lián)規(guī)則。處理結果通過Text Viewer以表格形式顯示給用戶。
WEKA-based Signalling Equipment Predictive Maintenance Information System
ZHAO Xiaofeng
( Shanghai Fuxin Intelligent Transportation Solutions Co.Ltd.,Shanghai 201210,China)
Signaling Equipment Predictive Maintenance Information System was used to implement data mining for maintenance information of subsystems in signalling system,combine with reliability,availability,and maintenanceability analysis result,set predictive maintenance strategy,defne fault information collection template,provide free software WEKA-based predictive maintenance method,use the method software integrity development,build models of classifers,cluster and association.This method was helpful to shorten development period as well as reduce software cost effectively.
predictive maintenance;free software;data mining;classify;cluster;association
U284.7∶TP39
A
1005-8451(2016)01-0052-04
2015-05-07
趙曉峰,高級工程師。