亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于機器學習的列車設備故障預測模型研究

        2020-12-31 03:24:26潘兆馬楊學鋒鄒文露
        計算機與現(xiàn)代化 2020年12期
        關鍵詞:分類故障設備

        袁 焦,王 珣,潘兆馬,楊學鋒,鄒文露

        (中國中鐵二院工程集團有限責任公司,四川 成都 610031)

        0 引 言

        車載設備是高速鐵路列控系統(tǒng)的大腦中樞,是保證其運行安全和運營效率的核心要素。隨著我國高速鐵路和運輸體量的迅速增長,迫切需要提高高速鐵路運輸效率和運營安全,而車載設備故障的快速排除、定位、診斷和維護手段的優(yōu)化是其決定性因素。然而,列車實際運行過程中,高速鐵路車載設備快速、實時和連續(xù)地產(chǎn)生海量的流數(shù)據(jù),數(shù)據(jù)量龐大、高維性、多源異構(gòu)且故障模式分布不均衡等特點為數(shù)據(jù)的記錄、整合和高效提取帶來巨大挑戰(zhàn),難以快速實時地根據(jù)數(shù)據(jù)對故障進行準確預測和智能分類。鑒于以上原因,實現(xiàn)準確高效的車載設備故障識別具有極其重要的意義。

        初期的車載設備故障預測模型主要是基于傳統(tǒng)的靜態(tài)存儲數(shù)據(jù)如車載日志等對故障進行分析和挖掘,但是流式數(shù)據(jù)難以實現(xiàn)全部有效存儲,靜態(tài)存儲數(shù)據(jù)后再進行遍歷的傳統(tǒng)方法明顯不再有效。隨后提出的基于流數(shù)據(jù)的機器學習預測模型在智能交通系統(tǒng)[1]、高速公路實時安全風險預測[2]、地理信息系統(tǒng)[3]、地熱學[4]、金融交易平臺[5]、基礎設施智能儀表[6]、垃圾郵件與垃圾郵件發(fā)送者識別[7]和黑洞模擬模型[8]等領域,具有較高的準確性。因而,利用機器學習對流數(shù)據(jù)進行直接分析和挖掘十分必要,可以更快速、實時和準確地對車載設備故障進行排除、定位及診斷。但是,數(shù)據(jù)分類是極其重要的數(shù)據(jù)挖掘技術(shù),流數(shù)據(jù)的分類是流式數(shù)據(jù)分析和挖掘的核心和難點。季一木等人指出,對高速鐵路車載設備流數(shù)據(jù)分類的關鍵在于根據(jù)流式數(shù)據(jù)增量學習構(gòu)造一個分類函數(shù)或分類變量,能夠?qū)⑿碌妮斎胱兞坑成涞骄唧w的類別變量上[9-11]。

        針對上述關鍵問題,本文關注利用機器學習中的決策樹進行流數(shù)據(jù)分類的方法。決策樹是機器學習中的一個樹狀預測模型,調(diào)整后的決策樹相較于其他分類算法計算量更小,更適用于處理多源異構(gòu)、連續(xù)性和實時性的流數(shù)據(jù)[12-13]?;谝?guī)范化的列控設備流數(shù)據(jù)的特征,本文首先采用CVFDT決策樹算法,然后結(jié)合自適應的學習過程和時間滑動窗口提高模型的準確率和實時性[14-15],構(gòu)建車載設備管理維護平臺,以期提高故障識別和診斷準確率,提升高速鐵路運營安全和效率。

        1 高速鐵路車載設備

        高速鐵路列控車載系統(tǒng)是保證列車運行安全和效率的關鍵設備。我國列控系統(tǒng)在參照歐洲列控標準的基礎上,結(jié)合自身列車特點,建立了CTCS(Chinese Train Control System)標準[16]。CTCS可劃分為5個等級,由CTCS-0至CTCS-4組成。目前,CTCS-3級是我國重點采用的列控系統(tǒng),它可通過無線通信設備實現(xiàn)車地通信,在高速運行中對列車進行有效管理[17]。高速鐵路車載設備結(jié)構(gòu)如圖1所示,車載系統(tǒng)包含主用和備用2系,可提高系統(tǒng)可靠性。車載設備主要由無線通信單元(GSM-R)、人機界面(DMI)、網(wǎng)關(TSG)、司法記錄單元(JRU)、C3主控單元(ATPCU)、C2主控單元(C2CU)、測速智能處理單元(SDP)、應答器信息傳輸單元(BTM)、應答器讀取天線(CAU)、測速測距單元(SDU)、安全傳輸單元、無線傳輸單元、TCR軌道電路信息讀取器和MVB總線等構(gòu)成。

        圖1 高速鐵路車載設備結(jié)構(gòu)圖

        車載智能設備記錄數(shù)據(jù)主要來源于車載模塊數(shù)據(jù)、MVB總線數(shù)據(jù)和JRU司法記錄單元數(shù)據(jù)。車載模塊數(shù)據(jù)主要來源于C3主控單元、C2主控單元、測速智能處理單元和網(wǎng)關。其中,C3和C2主機模塊是列車的核心控制單元,是最重要的數(shù)據(jù)來源。在列車高速運行中,可根據(jù)流數(shù)據(jù)對列車設備頻發(fā)的故障進行高效分析,智能診斷車載設備故障類別,如BTM相關、ATPCU相關、SDU相關和JRU相關故障等。

        2 流數(shù)據(jù)與決策樹分類算法

        2.1 鐵路車載智能設備中的流數(shù)據(jù)

        流數(shù)據(jù)通常是指一組大量的無邊界的數(shù)據(jù)項序列,其具有連續(xù)性、大量性、實時性、變化性、多樣性等特點。通常用時間序列模型(Time Series Model)表示。例如,令t表示時間戳,at表示t時間戳到達的數(shù)據(jù),則流數(shù)據(jù)可以表示為{…,at-1,at,at+1,…}[18]。流數(shù)據(jù)通常使用元組、鍵值對記錄等格式。

        在CTCS-3級列控系統(tǒng)運行過程中,C2CU、ATPCU、TSG、SDP等模塊會產(chǎn)生大量車載模塊數(shù)據(jù)。車載控制單元通過MVB總線進行數(shù)據(jù)交互,這部分數(shù)據(jù)被稱作MVB總線數(shù)據(jù)。同時C2CU、ATPCU這2個模塊與司法記錄器(JRU)之間通過Profibus總線進行數(shù)據(jù)交互,向JRU發(fā)送數(shù)據(jù),因此JRU設備中也存儲了大量的JRU數(shù)據(jù)[19]。車載設備模塊數(shù)據(jù)、MVB總線數(shù)據(jù)和JRU數(shù)據(jù)共同組成了車載智能設備數(shù)據(jù),這些數(shù)據(jù)都是在列車運行過程中實時產(chǎn)生的,屬于流數(shù)據(jù)的一種,可以通過串口、MVB總線以及網(wǎng)口分別進行采集并整理,并通過網(wǎng)絡實時發(fā)送到智能管理維護系統(tǒng)進行流數(shù)據(jù)分析處理,以了解各個設備工作運行狀態(tài),為及時發(fā)現(xiàn)和解決問題提供數(shù)據(jù)支持,從而實時、高效地進行車載智能設備的維護和管理。

        2.2 數(shù)據(jù)預處理

        通過以上方式采集到的車載智能設備原始數(shù)據(jù)中往往包含有部分噪聲數(shù)據(jù)、部分記錄不完整的數(shù)據(jù)以及記錄不一致或者冗余的數(shù)據(jù)。因此不能直接使用原始數(shù)據(jù)進行數(shù)據(jù)流決策樹分類,需要進行數(shù)據(jù)預處理操作。通過數(shù)據(jù)預處理能夠大幅提高車載設備中的流數(shù)據(jù)決策樹分類的精度和性能。其過程主要包括數(shù)據(jù)清理、數(shù)據(jù)集成、數(shù)據(jù)變換以及數(shù)據(jù)規(guī)約等。數(shù)據(jù)清理主要通過缺失值填充、光滑噪聲、識別離群點、糾正不一致數(shù)據(jù)等方式來完善和規(guī)范數(shù)據(jù);數(shù)據(jù)集成和數(shù)據(jù)變換是指根據(jù)需要將數(shù)據(jù)轉(zhuǎn)換為易處理的形式進行分類學習,以發(fā)現(xiàn)其中潛在的規(guī)律;數(shù)據(jù)規(guī)約技術(shù)在盡量保持數(shù)據(jù)完整性的同時對原始數(shù)據(jù)進行壓縮,大大縮小了數(shù)據(jù)集規(guī)模,使得對規(guī)約后的數(shù)據(jù)分析更加有效,并保持與原數(shù)據(jù)分析結(jié)果基本一致。其常用方法主要有:數(shù)值規(guī)約、維規(guī)約、數(shù)據(jù)立方聚集、數(shù)據(jù)屬性子集選擇、離散化以及概念分層產(chǎn)生等。

        2.3 決策樹分類算法

        在完成對數(shù)據(jù)預處理之后,則進行車載設備數(shù)據(jù)流分類。由于車載智能設備在列車運行過程中所產(chǎn)生的數(shù)據(jù)具有規(guī)模大、類型多、高速動態(tài)變化、實時連續(xù)等特點,為了從大量的信息中快速挖掘設備異常相關的參數(shù)信息,傳統(tǒng)數(shù)據(jù)挖掘方法已不再適用于列車車載設備數(shù)據(jù)流應用場景,因此本文對車載設備數(shù)據(jù)利用數(shù)據(jù)流挖掘算法實現(xiàn)對設備故障關鍵信息的識別。首先通過Hoeffding樹構(gòu)建單分類決策樹模型對車載設備數(shù)據(jù)流進行初步分類。在此基礎上,為解決車載數(shù)據(jù)流隨時間變化產(chǎn)生的概念漂移,本文應用CVFDT算法,在Hoeffding樹的基礎上添加滑動窗口,從而使得建立決策樹模型的數(shù)據(jù)流能夠不斷實現(xiàn)更新,保持車載設備數(shù)據(jù)分類模型的準確率。

        2.3.1 Hoeffding樹

        Hoeffding樹[20]是決策樹的一個變種,由華盛頓大學教授Pedro Domingos和Geoff Hulten在2000年提出。它是基于Hoeffding不等式構(gòu)建的,Hoeffding不等式給出了隨機變量的和與其期望值偏差的概率上限:

        (1)

        Hoeffding樹的基本思想如下:

        設G是增益函數(shù)(如信息增益、基尼指數(shù)等),xa,xb是待分類數(shù)據(jù)的2個屬性,在所有分類屬性中,xa對應的增益值最高,xb對應的增益值次之。令:

        (2)

        (3)

        其中,R表示隨機變量的取值范圍,n表示樣本數(shù)量。要使xa更加接近于最佳分類屬性,則要求誤差ε足夠小,由上式可知,ε是隨著隨機變量個數(shù)n的增加而遞減的。

        基于以上基本思想,Hoeffding樹在某個節(jié)點選擇屬性時,在足夠多的訓練數(shù)據(jù)中求出最佳分類屬性作為該節(jié)點的測試屬性,然后根據(jù)該屬性的不同值所對應的類,采用分治的方式遞歸地獲取下一層節(jié)點的測試屬性,如果樣本數(shù)據(jù)都在同一個類,則該節(jié)點為樹葉,并用該類標記,最終形成一棵決策樹。該算法對數(shù)據(jù)雖然是一次掃描,但是在保證誤差ε足夠小的情況下,需要增加樣本數(shù)量n,從而增加了對內(nèi)存的需求,這是該算法的瓶頸。

        2.3.2 CVFDT算法

        CVFDT算法[21](Concept-adapting Very Fast Decision Tree classification algorithm)是基于Hoeffding樹的一種增量式的分類算法。CVFDT決策樹可以動態(tài)改變窗口大小,根據(jù)當前已有數(shù)據(jù)構(gòu)建臨時決策樹,在新的數(shù)據(jù)到來后動態(tài)地優(yōu)化該決策樹。當決策樹的某個節(jié)點發(fā)生概念漂移時,會在該節(jié)點構(gòu)建新的替代子樹,當替代子樹的分類效果優(yōu)于原決策子樹時,則替代子樹改為新的決策子樹。CVFDT決策樹的構(gòu)建主要可以分為3個過程,分別是CVFDTGrow,ForgetExample和CheckSplitValidity。其流程如圖2所示。

        圖2 CVFDT決策樹流程圖

        3 鐵路車載設備管理CVFDT模型

        3.1 車載流數(shù)據(jù)特征提取

        車載設備故障數(shù)據(jù)通常是由自然語言描述的文本信息,因此需要對原始數(shù)據(jù)進行預處理和特征提取。首先根據(jù)相關故障詞匯在文本中出現(xiàn)的頻率和相關歷史經(jīng)驗,人為提取出具有代表性的故障詞匯和故障類型。如表1和表2所示。

        表1 故障詞匯表

        表2 故障類型表

        然后針對這些故障詞匯,采用TF-IDF(詞頻-逆文本頻率)方法對其在文本中出現(xiàn)的頻率和權(quán)重進行計算。

        對特定詞語t在文檔d中的權(quán)重值w的計算公式如下:

        (4)

        式中,tf表示特定詞語t在文本d中出現(xiàn)的頻率,N為文本中詞語的總個數(shù),n為特定詞語t在文本中出現(xiàn)的次數(shù),N/n為逆文本頻率指數(shù)(即IDF)。

        從而對文本數(shù)據(jù)進行向量化來提取其特征,將原文本信息轉(zhuǎn)化為帶權(quán)重的詞集,形成規(guī)范的訓練數(shù)據(jù)。如表3所示。

        表3 規(guī)范化車載設備故障數(shù)據(jù)結(jié)構(gòu)表

        3.2 構(gòu)建CVFDT模型

        使用CVFDT算法對車載設備故障分類的算法如下:

        T為空子樹,初始節(jié)點統(tǒng)計數(shù)n=0,m為檢查樹增長的樣例數(shù),w為窗口所能容納的數(shù)據(jù)塊大小。對于輸入的車載設備故障數(shù)據(jù)流(x,y),將其添加進窗口W中。

        1) If |W|>w

        ①從窗口W中刪除樣本;

        ②釋放空間。

        2) CVFDTGrow增長過程。

        ①樣本數(shù)據(jù)(x,y)流入葉子節(jié)點L;

        ②對(x,y)經(jīng)過的每個節(jié)點Li,更新各個節(jié)點統(tǒng)計數(shù)n;

        ③對節(jié)點Li中的替代子樹ALT(Li),遞歸調(diào)用CVFDTGrow增長函數(shù);

        ④計算信息熵,找到最佳分類屬性A進行分裂。

        3) CheckSplitValidity過程。

        ①對于每個非葉子節(jié)點L的替代子樹ALT(L)進行遞歸調(diào)用CheckSplitValidity過程;

        ②如果L的最佳分裂屬性不是當前屬性A,Aa是達到最大觀測值G的屬性,Ab是次最大觀測值G的屬性;

        ③IfG(Aa)-G(Ab)>ε

        ④Aa取代A成為當前最佳分裂屬性。

        以上的算法過程中,CVFDT通過不斷輸入的車載設備故障流數(shù)據(jù),進行訓練,生成了一個反映當前數(shù)據(jù)分布的實時模型,能夠反映當前車載設備故障的實時狀態(tài),具有更好的分類預測效果,適用于復雜多變的列車運行環(huán)境。

        3.3 車載設備故障預測結(jié)果分類

        圖3 車載設備故障預測圖

        在列車運行過程中,車載設備所產(chǎn)生的主要故障有:車地通信相關故障(47%)、ATPCU相關故障(24%)、BTM相關故障(13%)、列車接口相關故障(5%)及其他故障(11%)等。現(xiàn)將各類故障結(jié)果分為低概率發(fā)生、高概率發(fā)生、已發(fā)生這3類,可表示為圖。通過對故障預測結(jié)果進行分類,可以使管理人員實時監(jiān)控車載設備運行狀況,更加準確地定位故障位置,以便高效地處理故障。故障預測結(jié)果分類如圖3所示。

        3.4 模型總體架構(gòu)

        基于車載流數(shù)據(jù)的實時故障診斷方法,需要構(gòu)建數(shù)據(jù)采集、傳輸、處理及顯示的軟硬件系統(tǒng)。其系統(tǒng)主要由3個部分組成:車載設備數(shù)據(jù)采集器、服務器和客戶端。工作的基本原理為車載設備采集數(shù)據(jù)后,上傳到服務器,服務器根據(jù)已構(gòu)建好的基于CVFDT算法的模型和車載信息流數(shù)據(jù)進行預測以判斷列車各設備運行狀態(tài)。最后將預測結(jié)果傳送到客戶端,供工作人員實時監(jiān)控和維護車載設備。

        1)車載設備數(shù)據(jù)采集器。

        通過統(tǒng)一的數(shù)據(jù)接口,將各設備采集到數(shù)據(jù)進行匯總后(主要有車載模塊數(shù)據(jù)、MVB總線數(shù)據(jù)和JRU司法記錄單元數(shù)據(jù)),通過移動通信網(wǎng)實時傳送到服務器。要求車載數(shù)據(jù)采集設備具備安全、穩(wěn)定、可靠等特點。

        2)服務器。

        負責接收和保存車載設備傳輸?shù)臄?shù)據(jù),同時將實時到達的流數(shù)據(jù)進行預處理后,輸入CVFDT模型中,進行訓練、分類,以實時預測各設備故障發(fā)生的可能性。同時實時保存其預測結(jié)果。用戶可以從客戶端上下載設備所采集到的歷史數(shù)據(jù)和設備故障預測結(jié)果。

        圖4 系統(tǒng)流程原理圖

        3)客戶端。

        用戶通過客戶端軟件來實時監(jiān)控車載設備各部件的工作狀況,實時查看各部件發(fā)生故障可能性的大小,對于當前可能高概率發(fā)生的故障,設立系統(tǒng)預警機制,及時通知用戶進行排查和消除,以避免故障的發(fā)生。針對已發(fā)生的故障,可查看與故障相關的工作部件的歷史車載數(shù)據(jù)流,并可供下載,進行后續(xù)系統(tǒng)的分析。

        系統(tǒng)的基本流程設計原理如圖4所示。

        3.5 實驗分析

        本次實驗采用了2016—2018年度CTCS3-300T型車載設備歷史數(shù)據(jù)中抽取的共11583條實時流數(shù)據(jù)進行測試,將其分為訓練集與測試集。

        訓練集包含:1)列車各車載設備正常運行所產(chǎn)生的部分流數(shù)據(jù)7489條;2)列車發(fā)生車地通信相關故障、ATPCU相關故障、BTM相關故障以及列車接口等相關故障前后1 min內(nèi),車載設備的部分流數(shù)據(jù)共計517條。

        測試集包含:1)列車各車載設備正常運行所產(chǎn)生的部分流數(shù)據(jù)3496條;2)列車發(fā)生車地通信相關故障、ATPCU相關故障、BTM相關故障以及列車接口等相關故障前后1 min內(nèi),車載設備的部分流數(shù)據(jù)共計321條。

        本實驗分別采用了常用的3種流計算分類算法(BP神經(jīng)網(wǎng)絡、樸素貝葉斯法(NaiveBayes)、CVFDT)進行車載設備故障預測準確率驗證,通過7次調(diào)整訓練集與測試集的數(shù)量,得到實驗對比結(jié)果如圖5所示,其平均準確率分別為BP神經(jīng)網(wǎng)絡90.89%、NaiveBayes 87.78%、CVFDT 94.13%。

        圖5 車載設備故障預測模型分類實驗

        實驗結(jié)果表明,基于流數(shù)據(jù)的CVFDT算法車載設備故障預測模型相較于其他算法準確率高,可以較好地監(jiān)控和反饋車載設備工作狀況,輔助工作人員診斷故障和維護設備,提高工作效率,保障鐵路車載設備的正常運行。

        4 結(jié)束語

        隨著高速鐵路的迅速發(fā)展,對列控設備自動化、設備故障智能診斷和預測的要求不斷提高。本文通過車載設備數(shù)據(jù)特征分析,采用CVFDT決策樹算法,對車載模塊流數(shù)據(jù)、MVB總線流數(shù)據(jù)和JRU司法記錄單元流數(shù)據(jù)進行機器學習,一方面實現(xiàn)對不斷到來的流數(shù)據(jù)準確分類,實現(xiàn)車載設備故障精準定位,提高診斷效率;另一方面對車載設備故障發(fā)生概率進行預測,實現(xiàn)故障“事前排除”和防護,降低車載設備對高速鐵路運營安全和運輸效率的影響。然而,由于決策樹訓練類別不足,流數(shù)據(jù)分類中并未考慮不同故障間的關聯(lián)關系及故障間的交互影響程度。因此,在未來的研究中還需要提高對交互故障和關聯(lián)故障的診斷有效性。

        猜你喜歡
        分類故障設備
        諧響應分析在設備減振中的應用
        分類算一算
        故障一點通
        分類討論求坐標
        基于MPU6050簡單控制設備
        電子制作(2018年11期)2018-08-04 03:26:08
        數(shù)據(jù)分析中的分類討論
        教你一招:數(shù)的分類
        奔馳R320車ABS、ESP故障燈異常點亮
        500kV輸變電設備運行維護探討
        故障一點通
        草色噜噜噜av在线观看香蕉| 绿帽人妻被插出白浆免费观看| 日本在线一区二区三区四区| 91自拍视频国产精品| 成人毛片无码一区二区三区| 5级做人爱c视版免费视频| 国产成年无码久久久久下载| 在线视频观看一区二区| 欧美老妇多毛xxxxx极瑞视频| 亚洲精品国产第一区二区尤物| 音影先锋色天堂av电影妓女久久| 青青草视频在线播放观看| 无码人妻精品中文字幕| 三上悠亚久久精品| 99精品国产第一福利网站 | 日本免费视频一区二区三区| 日本国产成人国产在线播放| 日韩a毛片免费观看| 大陆啪啪福利视频| 国产精品国产三级国产专区不| 99精品久久精品一区二区| 国产欧美日韩在线观看| 亚洲免费视频一区二区三区| 久久精品日本不卡91| 国产成人无码免费视频在线 | 国产精品日本一区二区在线播放| 亚洲av久久无码精品九九| 无码AV大香线蕉伊人久久| 日本免费一区二区三区在线播放| 曰韩亚洲av人人夜夜澡人人爽| 91视频免费国产成人| 亚洲一区二区一区二区免费视频| 欧美疯狂性受xxxxx喷水| 亚洲精品一区二区三区大桥未久| 成人无码激情视频在线观看| 国产黄色三级一区二区三区四区| 夜夜揉揉日日人人青青| 国产真实露脸4p视频| 亚洲av手机在线一区| 日韩av午夜在线观看| 精品国产午夜福利在线观看|