亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于數(shù)據(jù)挖掘的鐵路信號(hào)設(shè)備故障自動(dòng)診斷分析

        2022-01-06 06:01:54孫尉筌
        工程建設(shè)與設(shè)計(jì) 2021年22期
        關(guān)鍵詞:鐵路信號(hào)分詞分類器

        孫尉筌

        (中鐵第一勘察設(shè)計(jì)院集團(tuán)有限公司,西安 710043)

        1 引言

        自“八橫八縱”鐵路網(wǎng)規(guī)劃建設(shè)提出以來,我國鐵路運(yùn)輸事業(yè)邁入了蓬勃發(fā)展階段,綜合化、網(wǎng)絡(luò)化、智能化、數(shù)字化成為現(xiàn)代鐵路運(yùn)輸系統(tǒng)發(fā)展的主要方向。而信號(hào)控制系統(tǒng)是現(xiàn)代鐵路運(yùn)輸?shù)摹爸袠猩窠?jīng)”,信號(hào)設(shè)備故障的出現(xiàn)不僅會(huì)干擾鐵路行車效率,還會(huì)對(duì)行車安全造成較大的威脅。加之現(xiàn)有信號(hào)報(bào)告多以文本形式記錄,存儲(chǔ)、分析難度較大。因此,文本以數(shù)據(jù)挖掘?yàn)榛A(chǔ),探討短時(shí)間內(nèi)辨識(shí)鐵路信號(hào)設(shè)備故障特征并自動(dòng)推敲原因的方案尤為關(guān)鍵。

        2 基于數(shù)據(jù)挖掘的故障自診斷整體架構(gòu)

        基于數(shù)據(jù)挖掘的故障自診斷整體架構(gòu)主要包括智能診斷層、模型優(yōu)化層、數(shù)據(jù)預(yù)處理層3 個(gè)層次。其中,智能診斷層主要負(fù)責(zé)根據(jù)中間層獲得的故障信息進(jìn)行故障數(shù)據(jù)的自動(dòng)查閱,或根據(jù)現(xiàn)有故障現(xiàn)象搜索歷史經(jīng)驗(yàn),提高故障診斷準(zhǔn)確率,具體流程為:待診斷故障數(shù)據(jù)→集成分類器→軌道電路故障/道岔故障/信號(hào)機(jī)故障/……;模型優(yōu)化層為中間層,主要負(fù)責(zé)利用支持向量機(jī)、邏輯回歸基分類器隨機(jī)森林集成分類機(jī),結(jié)合參數(shù)特點(diǎn),對(duì)預(yù)處理后數(shù)據(jù)進(jìn)行調(diào)優(yōu),具體流程為:初始化參數(shù)→基分類器/集成分類器→集中學(xué)習(xí)群(Voting);數(shù)據(jù)預(yù)處理層主要負(fù)責(zé)鐵路信號(hào)設(shè)備故障文本非結(jié)構(gòu)化數(shù)據(jù)的預(yù)處理。即抽取文本數(shù)據(jù)特征并將其轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別、核算的文本向量,從根源上規(guī)避樣本數(shù)據(jù)不均衡情況。具體流程為:原始文本數(shù)據(jù)→特征向量矩陣→分類標(biāo)簽→不均衡數(shù)據(jù)處理。

        3 基于數(shù)據(jù)挖掘的故障自診斷實(shí)現(xiàn)方案

        3.1 數(shù)據(jù)采集

        鐵路信號(hào)設(shè)備涉及調(diào)度指揮系統(tǒng)設(shè)備、列控系統(tǒng)設(shè)備、聯(lián)鎖系統(tǒng)設(shè)備閉塞設(shè)備等多種類型。為保障上述設(shè)備無故障運(yùn)轉(zhuǎn),鐵路內(nèi)構(gòu)建了不同類別的監(jiān)測系統(tǒng)或監(jiān)控系統(tǒng),上述系統(tǒng)可以以圖形圖像、語音、文本形式進(jìn)行非結(jié)構(gòu)化數(shù)據(jù)存儲(chǔ)[1]。在日常維護(hù)修理階段,也可以以文本形式進(jìn)行不同類型信號(hào)設(shè)備故障現(xiàn)象、原因、處理手段的描述積累。長期下來,形成了以Excel、Word 形式存儲(chǔ)的海量故障數(shù)據(jù),如事后追蹤報(bào)告、行車日志等。在行車記錄登記簿、事故故障追蹤報(bào)告、日志維修臺(tái)賬記錄等信號(hào)集中監(jiān)測系統(tǒng)監(jiān)測的異常數(shù)據(jù)輸出文本采集的同時(shí),還可以進(jìn)行結(jié)構(gòu)化數(shù)據(jù)、外部數(shù)據(jù)的收集。如設(shè)備狀態(tài)、線路狀態(tài)、氣象局?jǐn)?shù)據(jù)、公安局?jǐn)?shù)據(jù)等。

        3.2 信號(hào)預(yù)處理

        由于外界環(huán)境的干擾,鐵路信號(hào)設(shè)備狀態(tài)數(shù)據(jù)無法保證完全有效,部分無效信息常以噪聲形式存在?;诖?,信號(hào)預(yù)處理的主要目的是將指定無價(jià)值符號(hào)去除,使文本內(nèi)僅保留漢字。進(jìn)而對(duì)文本進(jìn)行分詞并將停用詞去除,促使文本最終轉(zhuǎn)化為可輸入至算法的向量,為后期文本特征的提取、分類奠定基礎(chǔ)[2]。根據(jù)不同語言的文本差異,適用的分詞方法也存在一些差異。對(duì)于中文分詞,可以將一個(gè)漢字序列向單獨(dú)次切分。比如,在事先建立的統(tǒng)一詞典表內(nèi)進(jìn)行分析句子拆分,并將其與詞典內(nèi)的詞條進(jìn)行逐一匹配,在確定二者匹配后結(jié)束分詞,反之則繼續(xù)進(jìn)行拆分。整個(gè)過程中可用的分詞工具主要有jieba(Python 中文分詞組件)分詞系統(tǒng)或NLPIR 分詞系統(tǒng),后者可以由用戶自定義“敏感點(diǎn)”實(shí)現(xiàn)自適應(yīng)分詞。比如,針對(duì)鐵路信號(hào)設(shè)備故障進(jìn)行道岔、紅光帶、軌道電路、信號(hào)機(jī)、轉(zhuǎn)轍機(jī)等故障詞典自定義。進(jìn)而采用NLPIR 分詞系統(tǒng)中的通用詞典對(duì)事故信號(hào)進(jìn)行分詞,獲得某故障文本結(jié)果為“//8#道岔 定位 無表示 15:46 銷記 原因 8#道岔 主機(jī) 動(dòng)作桿與 鎖框 摩卡 別勁 …… A 機(jī) 系統(tǒng) 報(bào)警 輸出未 驅(qū)動(dòng)”。

        在分詞結(jié)束后,可以利用Word2vec 算法中的Skip-gram模型進(jìn)行詞向量轉(zhuǎn)化。即設(shè)定輸入層為若干個(gè)詞向量,由輸入層到隱層進(jìn)行上文向量、下文向量相加后獲得一個(gè)向量,進(jìn)而經(jīng)softmax 算法輸出所獲得的向量。Skip-gram 模型可以表示為:

        式中,L 為輸入層詞向量;P 為隱層詞向量;W 為詞;context(W)為上文向量、下文向量相加;C 為窗口長度,具體可看作當(dāng)前詞W(t)的前C 個(gè)詞、后C 個(gè)詞。通過求解公式(1)的最大值,可以訓(xùn)練詞向量。比如,軌道電路詞向量維數(shù)為180 維,對(duì)應(yīng)詞向量為[-0.125 621 315,0.015 213 511 2,…,0.205 121 458],將上述詞向量縱向累加后可以獲得整句話的具體含義。

        3.3 特征提取

        進(jìn)行特征提取時(shí),可以選擇基于統(tǒng)計(jì)的常用加權(quán)方法——TF-IDF 法,即假定某詞在某一文檔中多次出現(xiàn),且在其他文本中出現(xiàn)概率較小,甚至為0,則可以將這一詞匯看作對(duì)應(yīng)文本的關(guān)鍵詞,詞頻TFi,j可表示為:

        式中,TFi為詞頻;IDFi為逆向文檔頻率。在得到wi的權(quán)重后,考慮到各鐵路信號(hào)設(shè)備故障自診斷所面對(duì)的特征向量Ti,j間存在較大的差異,需要對(duì)其進(jìn)行歸一化操作。同時(shí),設(shè)鐵路信號(hào)設(shè)備故障為信號(hào)機(jī)故障、微機(jī)聯(lián)鎖故障、道岔故障、軌道電路故障,取若干組正常數(shù)據(jù),按正常狀態(tài)、故障狀態(tài)對(duì)分析數(shù)據(jù)進(jìn)行分組。分組后按不同故障狀態(tài)表現(xiàn)取值,將狀態(tài)對(duì)應(yīng)的幅值劃分為多個(gè)區(qū)段,以幅值最小的區(qū)段記錄為起始區(qū)間,取連續(xù)多個(gè)區(qū)間進(jìn)行有效點(diǎn)的分布線密度計(jì)算[3]。逐次遞增進(jìn)行下一個(gè)區(qū)間線密度計(jì)算。最終取線密度最大的區(qū)間進(jìn)行均值計(jì)算,獲得估算正常值。同時(shí),選擇一個(gè)備分析序列數(shù)據(jù)作為分析目標(biāo),將其按狀態(tài)順序分組,按狀態(tài)順序取一組數(shù)據(jù)判斷是否滿足式(4),若滿足則進(jìn)入下一步,反之則為異常數(shù)據(jù)去除。則在正常狀態(tài)下參數(shù)錯(cuò)誤(E0)、壓縮機(jī)高壓保護(hù)故障(E1)、燈箱型元顯示錯(cuò)誤(E2)、壓縮機(jī)低壓保護(hù)故障(E3)分別為0.121、0.232、0.211、0.105 時(shí),信號(hào)機(jī)故障下E0、E1、E2、E3分別為0.072、0.103、0.387、0.168,微機(jī)聯(lián)鎖故障下E0、E1、E2、E3分別為0.222、0.255、0.136、0.258,道岔故障下E0、E1、E2、E3分別為0.232、0.289、0.200、0.132,軌道電路故障下E0、E1、E2、E3分別為0.099、0.198、0.152、0.177。

        3.4 故障分類

        故障分類主要是針對(duì)故障記錄文本內(nèi)容,利用一個(gè)決策函數(shù)進(jìn)行位置文本類別劃分??紤]到經(jīng)向量化的數(shù)據(jù)兼具高維度、稀疏特征,首先需要利用基分類器進(jìn)行處理[4]。比如,設(shè)定向量數(shù)據(jù)集數(shù)量為n,特征維度為m,分類數(shù)為c,利用LR分類器進(jìn)行統(tǒng)計(jì)后可以得到分類結(jié)果。在基分類器處理完畢之后,可以利用以Voting 的集成分類器按照分類器錯(cuò)誤率均無聯(lián)系的策略,進(jìn)行分類操作,以便盡可能選擇多樣、精確分類結(jié)果,避免分類中位置統(tǒng)計(jì)、核算風(fēng)險(xiǎn)的出現(xiàn)。

        3.5 參數(shù)優(yōu)化

        參數(shù)優(yōu)化的主要目的是進(jìn)行不平衡數(shù)據(jù)處理,常常用合成少數(shù)過采樣技術(shù),即SMOTE 算法。在基于SMOTE 算法的參數(shù)優(yōu)化過程中,首先需要輸入多數(shù)類樣本集和少數(shù)類樣本集,以歐式距離D 為標(biāo)準(zhǔn)計(jì)算樣本到少數(shù)類樣本集的距離[5]。同時(shí),根據(jù)數(shù)據(jù)集不平衡比例進(jìn)行采樣倍率設(shè)置,由歐式距離D 選出最近的幾個(gè)樣本作為一個(gè)組合,每個(gè)組合樣本中2 個(gè)與2 個(gè)之間隨機(jī)連線,獲得新的少數(shù)類樣本并加入數(shù)據(jù)集內(nèi),循環(huán)后輸出新樣本集。上述方法可以滿足分布于密集域內(nèi)樣本參數(shù)優(yōu)化要求,而對(duì)于分布在稀疏域內(nèi)的樣本點(diǎn),可以輸入多數(shù)類樣本集、少數(shù)類樣本集后,設(shè)置閾值、采集倍率,進(jìn)行少數(shù)類樣本集、多數(shù)類樣本集以及二者的鄰集計(jì)算,選取若干個(gè)近鄰點(diǎn)生成新的樣本。若相鄰集中不含少數(shù)類樣本,則可以直接將其看作噪聲去除。

        3.6 診斷實(shí)現(xiàn)

        考慮到鐵路信號(hào)設(shè)備故障復(fù)雜度較高,且兼具不確定性、可傳播性,因此,為了順利實(shí)現(xiàn)參數(shù)優(yōu)化,可以面向故障自動(dòng)診斷需求,以傳統(tǒng)Petri 網(wǎng)為基礎(chǔ)進(jìn)行故障自動(dòng)診斷的Petri 有機(jī)純網(wǎng)構(gòu)建[6]。即設(shè)定面向鐵路信號(hào)設(shè)備故障自動(dòng)診斷的Petri十元組為:

        式(4)為基于P/T 網(wǎng)的故障自動(dòng)傳播系統(tǒng)。其中,N 是三元組(基網(wǎng)),N=(P,T,F(xiàn),),T 為有限為空的庫所集合;F 為故障因子數(shù)量;P 為有限非空的庫所集合;W 為集合標(biāo)識(shí),集合的初始標(biāo)識(shí)為1;K 為容量函數(shù),K∈{0,1};α 為真實(shí)度函數(shù)值,α∈{0,1},α>0 表示事件可信度較大,反之則表示完全不可信;μ、p 分別表示在T 上的實(shí)函數(shù)和各有向弧的概率權(quán)重函數(shù),前者代表變遷對(duì)應(yīng)故障自動(dòng)診斷規(guī)則的置信度;后者表示經(jīng)驗(yàn)給定值,p=0 表示當(dāng)前條件下不可發(fā)生事件,p=1 表示當(dāng)前條件下的一定發(fā)生事件。

        4 基于數(shù)據(jù)挖掘的故障自診斷應(yīng)用效果

        4.1 驗(yàn)證平臺(tái)

        為確定以數(shù)據(jù)挖掘?yàn)榛A(chǔ)的故障自診斷應(yīng)用效果,選擇4核CPU 計(jì)算機(jī),在32 GB 的內(nèi)存中安裝Windows2010 系統(tǒng),選擇傳統(tǒng)支持向量機(jī)、數(shù)據(jù)挖掘2 種鐵路信號(hào)設(shè)備診斷方法,在訓(xùn)練樣本為400 個(gè),測試樣本為100 個(gè)的情況下,將2種方法應(yīng)用效果進(jìn)行對(duì)比[7]。

        4.2 應(yīng)用效果

        從鐵路信號(hào)設(shè)備自診斷準(zhǔn)確度來看,正常狀態(tài)下,傳統(tǒng)支持向量機(jī)診斷準(zhǔn)確度為92.00%,基于數(shù)據(jù)挖掘的故障自診斷準(zhǔn)確度為96.00%;故障狀態(tài)下,傳統(tǒng)支持向量機(jī)診斷準(zhǔn)確度為91.00%~93.00%,基于數(shù)據(jù)挖掘的故障自診斷準(zhǔn)確度為94.00%~97.00%,這主要是由于傳統(tǒng)支持向量機(jī)在小樣本調(diào)解下訓(xùn)練參數(shù)確定方式為隨機(jī),信號(hào)設(shè)備診斷準(zhǔn)確度低于數(shù)據(jù)挖掘方法。

        從鐵路信號(hào)設(shè)備自診斷時(shí)間來看,正常狀態(tài)下,傳統(tǒng)支持向量機(jī)診斷時(shí)間為6.00 s,基于數(shù)據(jù)挖掘的故障自診斷時(shí)間為4.80 s;故障狀態(tài)下,傳統(tǒng)支持向量機(jī)診斷時(shí)間為6.00~8.00 s,基于數(shù)據(jù)挖掘的故障自診斷時(shí)間為3.80~4.00 s,表明基于數(shù)據(jù)挖掘的鐵路信號(hào)設(shè)備故障自動(dòng)診斷方法可以有效壓縮故障診斷時(shí)間,優(yōu)化鐵路信號(hào)設(shè)備故障診斷效率。

        5 結(jié)語

        綜上所述,為了順利發(fā)掘文本數(shù)據(jù)中蘊(yùn)含的海量高價(jià)值故障特征信息,保證信號(hào)設(shè)備故障報(bào)告的使用價(jià)值,技術(shù)人員可以選擇數(shù)據(jù)挖掘技術(shù),對(duì)現(xiàn)有信號(hào)設(shè)備故障進(jìn)行匯總剖析,自動(dòng)分辨識(shí)別設(shè)備故障報(bào)告中特征。并對(duì)現(xiàn)有信號(hào)設(shè)備故障案例提取高頻詞匯,以固定故障案例中文分詞+形式化自定義規(guī)則的形式,進(jìn)行故障信息提取和原因追溯,為故障處理與改進(jìn)決策提供助力。

        猜你喜歡
        鐵路信號(hào)分詞分類器
        渝貴鐵路信號(hào)系統(tǒng)聯(lián)調(diào)聯(lián)試的思考與建議
        結(jié)巴分詞在詞云中的應(yīng)用
        鐵路信號(hào)設(shè)備維修管理信息系統(tǒng)設(shè)計(jì)與開發(fā)
        BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
        電子測試(2018年1期)2018-04-18 11:52:35
        雷擊對(duì)鐵路信號(hào)系統(tǒng)的影響探討
        值得重視的分詞的特殊用法
        加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
        結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
        既有鐵路信號(hào)改造工程實(shí)施與研究
        基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
        妇女bbbb插插插视频| 亚洲国产免费一区二区| 久久精品伊人久久精品| 久久国产在线精品观看| 久久精品国产亚洲av麻豆长发| 黑人巨大跨种族video| 精品国产18禁久久久久久久| 挑战亚洲美女视频网站| 日本亚洲视频免费在线看 | 亚洲国产天堂久久综合| 欧洲熟妇色xxxx欧美老妇多毛网站| 国产va在线播放| 国产在线视频一区二区三区| 久久综合精品人妻一区二区三区 | 亚洲综合久久精品无码色欲| 亚洲小说图区综合在线| 久久伊人网久久伊人网| 女优av一区二区在线观看| 欧美激情一区二区三区成人| 中文字幕一区二区三区乱码| 国产激情视频在线观看首页 | 在线一区二区三区国产精品| 免费国产黄网站在线观看可以下载| 欧美情侣性视频| 国产精品一级av一区二区 | 欲女在线一区二区三区| 少妇内射兰兰久久| 国产偷窥熟女精品视频| 国产人妖在线免费观看| 在线播放国产自拍av| 精品久久人妻av中文字幕| 成年女人毛片免费视频| 胳膊肘上有白色的小疙瘩| 国产亚洲一二三区精品| 性久久久久久| a级毛片毛片免费观看久潮喷| 麻豆久久久国内精品| 国产丝袜美腿中文字幕| 凹凸国产熟女精品视频app| 国产精品久久久久电影网| 手机在线中文字幕国产|