徐田華,楊連報(bào),胡紅利,王小鑫
(1.北京交通大學(xué)軌道交通控制與安全國家重點(diǎn)實(shí)驗(yàn)室,100044,北京;2.西安交通大學(xué)電力設(shè)備電氣絕緣國家重點(diǎn)實(shí)驗(yàn)室,710049,西安)
?
高速鐵路信號(hào)系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護(hù)決策
徐田華1,楊連報(bào)1,胡紅利2,王小鑫2
(1.北京交通大學(xué)軌道交通控制與安全國家重點(diǎn)實(shí)驗(yàn)室,100044,北京;2.西安交通大學(xué)電力設(shè)備電氣絕緣國家重點(diǎn)實(shí)驗(yàn)室,710049,西安)
針對(duì)高速鐵路智能維護(hù)決策中的信息多源異構(gòu)問題,提出了高鐵信號(hào)系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護(hù)決策架構(gòu)。通過本地?cái)?shù)據(jù)庫資源描述框架(resource description framework (schema),RDF(S))到全局RDF(S)的轉(zhuǎn)換和基于RDF(S)圖的本體合并,實(shí)現(xiàn)了多源異構(gòu)信息的融合。利用適合缺失數(shù)據(jù)的結(jié)構(gòu)期望最大化(SEM)算法,結(jié)合專家知識(shí),構(gòu)建了高鐵信號(hào)系統(tǒng)的智能維護(hù)貝葉斯網(wǎng)絡(luò)(BN)決策模型。最后,利用高鐵武廣線2011~2012年的監(jiān)控?cái)?shù)據(jù),分別對(duì)基于RDF(S)圖的全局RDF(S)合并算法性能和故障診斷結(jié)果的準(zhǔn)確性進(jìn)行了分析對(duì)比,實(shí)驗(yàn)結(jié)果表明所提出的本體融合算法具有多項(xiàng)式級(jí)的計(jì)算復(fù)雜度,同時(shí)融合專家知識(shí)和SEM算法的智能維護(hù)BN決策模型的一級(jí)故障診斷準(zhǔn)確率為92.4%。因此,所提出的異構(gòu)數(shù)據(jù)融合和智能維護(hù)架構(gòu)可以有效提高高鐵信號(hào)系統(tǒng)維護(hù)決策的準(zhǔn)確性和有效性。
高速鐵路;信號(hào)系統(tǒng);異構(gòu)數(shù)據(jù);本體融合
近年來,我國高速鐵路正處于快速發(fā)展時(shí)期,逐步進(jìn)入網(wǎng)絡(luò)化運(yùn)營階段,在社會(huì)經(jīng)濟(jì)發(fā)展中起到了重要作用。高鐵信號(hào)系統(tǒng)是高速鐵路的大腦和神經(jīng)中樞,對(duì)保障高速鐵路安全、高效的運(yùn)營起關(guān)鍵作用。
與傳統(tǒng)的信號(hào)系統(tǒng)相比,高速鐵路信號(hào)系統(tǒng)不斷采用新技術(shù)和新設(shè)備。設(shè)備的先進(jìn)性一方面保證了系統(tǒng)運(yùn)行的高效性,同時(shí)也增加了故障的隱蔽性和突發(fā)性,為設(shè)備的故障定位和智能維護(hù)設(shè)置了障礙。另一方面,支撐高鐵信號(hào)系統(tǒng)可靠、高效運(yùn)營的運(yùn)營維護(hù)記錄和監(jiān)控?cái)?shù)據(jù)仍然存在多源異構(gòu)和信息非完整性等突出問題。造成這些問題的主要原因是維護(hù)記錄信息來源復(fù)雜,從司機(jī)、調(diào)度員、鐵路專家和維護(hù)人員的記錄日志到微機(jī)監(jiān)測(cè)系統(tǒng)、司法記錄儀(JRU)和列車動(dòng)態(tài)監(jiān)控系統(tǒng)(DMS)的設(shè)備記錄信息等組成了多源的維護(hù)記錄信息。更為重要的是,多源的維修記錄信息存在概念術(shù)語不統(tǒng)一、缺乏統(tǒng)一的格式和標(biāo)準(zhǔn)、維護(hù)數(shù)據(jù)語義不一致甚至沖突、維護(hù)記錄信息不完整等問題,因而無法形成一種有效的信息共享機(jī)制,最終形成了大量的信息孤島,不能有效地實(shí)現(xiàn)知識(shí)的共享和互操作,這將影響高鐵的智能運(yùn)營維護(hù)決策和行車效率。
因此,如何構(gòu)建高鐵信號(hào)系統(tǒng)規(guī)范統(tǒng)一的知識(shí)體系,在多源異構(gòu)數(shù)據(jù)融合的基礎(chǔ)上實(shí)現(xiàn)高鐵信號(hào)系統(tǒng)的智能維護(hù)決策,以適應(yīng)高鐵信號(hào)設(shè)備技術(shù)現(xiàn)代化發(fā)展需要,成為亟待解決的問題。
目前,國內(nèi)外學(xué)者在異構(gòu)信息的融合和智能維護(hù)決策等領(lǐng)域開展了卓有成效的探索。文獻(xiàn)[1-3]應(yīng)用本體論解決了歐洲鐵路領(lǐng)域內(nèi)由于運(yùn)營商和開發(fā)商不同而造成維護(hù)信息不統(tǒng)一的問題,實(shí)現(xiàn)了不同國家、不同格式鐵路基礎(chǔ)設(shè)施、旅客信息和設(shè)備管理信息的互操作和共享;文獻(xiàn)[4]主要應(yīng)用本體論對(duì)我國高鐵領(lǐng)域中各專業(yè)領(lǐng)域本體的融合方法進(jìn)行了研究;文獻(xiàn)[5-6]應(yīng)用本體論解決了鐵路選線時(shí)數(shù)據(jù)不統(tǒng)一、共享率低的問題;歐洲EuRoMain FP5-IST Project提出了通過建立維護(hù)數(shù)據(jù)的標(biāo)準(zhǔn)化文檔,實(shí)現(xiàn)不同來源的維護(hù)數(shù)據(jù)的共享,進(jìn)而搭建支持歐洲鐵路維護(hù)系統(tǒng)的解決方案[7]。但是,該項(xiàng)目還是建立在XML、XSLT等數(shù)據(jù)格式的基礎(chǔ)上。由于XML缺乏語義描述,因此很難實(shí)現(xiàn)在語義層次上的機(jī)器理解和處理。歐洲的InterGRail項(xiàng)目提出鐵路領(lǐng)域的信息共享,使得維護(hù)決策優(yōu)化得以實(shí)現(xiàn)[8]。在該項(xiàng)目參與者中,英國伯明翰大學(xué)的Cliver提出了使用本體論解決大規(guī)模軌道交通維護(hù)數(shù)據(jù)融合方法。在故障診斷和決策支持方面,Ferreiro和Vong等分別給出了基于案例的推理和基于貝葉斯網(wǎng)絡(luò)(BN)的運(yùn)輸系統(tǒng)故障診斷和決策維護(hù)[9-10],但其研究并未涉及異構(gòu)數(shù)據(jù)的融合和語義沖突的消除。
上述研究對(duì)推動(dòng)軌道交通領(lǐng)域的異構(gòu)數(shù)據(jù)融合和智能決策支持的發(fā)展起著重要作用,但針對(duì)高速鐵路信號(hào)數(shù)據(jù)記錄存在的多源異構(gòu)、非確定和不完整數(shù)據(jù)等突出問題,沒有提出統(tǒng)一的異構(gòu)數(shù)據(jù)融合和智能維護(hù)決策架構(gòu)。同時(shí),對(duì)于異構(gòu)數(shù)據(jù)的屬性抽取、轉(zhuǎn)換和融合缺乏嚴(yán)格的形式化定義,這將對(duì)后續(xù)的嚴(yán)格規(guī)范推理和智能維護(hù)決策造成不利影響。
針對(duì)上述問題,本文提出了高鐵信號(hào)系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護(hù)決策的統(tǒng)一架構(gòu),給出了局部關(guān)系數(shù)據(jù)庫到局部本體數(shù)據(jù)庫資源描述框架(resource description framework (schema),RDF(S))轉(zhuǎn)換的形式化定義,提出了匹配數(shù)據(jù)記錄時(shí)間和地點(diǎn)模式的本體合并方法,并給出了適合非確定和不完整數(shù)據(jù)的BN維護(hù)決策方法,最后利用武廣高鐵維護(hù)記錄數(shù)據(jù)驗(yàn)證了所提架構(gòu)和算法的可行性和正確性。
高鐵信號(hào)系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護(hù)架構(gòu)參見圖1,整個(gè)架構(gòu)分為3個(gè)層次。
最底層是實(shí)際的物理數(shù)據(jù)庫,分布在不同的電務(wù)段、車站、分局等數(shù)據(jù)庫中,內(nèi)容包括司機(jī)、調(diào)度員、鐵路專家和維護(hù)人員的記錄和信號(hào)監(jiān)控設(shè)備的監(jiān)控信息,如微機(jī)監(jiān)測(cè)、JRU記錄信息、AElog日志記錄、Abis協(xié)議記錄和DMS等。其突出的特點(diǎn)是:記錄缺乏統(tǒng)一的概念、術(shù)語及關(guān)系的準(zhǔn)確定義,存在概念歧義和語義沖突等問題,阻礙了高鐵信號(hào)系統(tǒng)維護(hù)信息的邏輯關(guān)系的建立,如故障模式、故障原因、故障征兆、測(cè)試手段、維護(hù)手段等。同時(shí),維護(hù)數(shù)據(jù)呈現(xiàn)明顯的不完整性和非確定性。高鐵信號(hào)系統(tǒng)維護(hù)數(shù)據(jù)來源多源化,分布在運(yùn)營維護(hù)人員和不同的監(jiān)控設(shè)備中,加之專家經(jīng)驗(yàn)和歷史數(shù)據(jù),其完整性、一致性和確定性都難以得到保證。
中間層為本體合并層。首先構(gòu)建對(duì)應(yīng)分布式數(shù)據(jù)庫的局部RDF(S)本體,抽取分布式數(shù)據(jù)庫的概念、屬性及其關(guān)聯(lián)關(guān)系。接著借助于RDF(S)圖的合成思路,定義關(guān)系數(shù)據(jù)庫到RDF(S)的形式化轉(zhuǎn)換方法,為下一步本體轉(zhuǎn)化的完備性和覆蓋性等性能驗(yàn)證提供依據(jù)。在模型轉(zhuǎn)換的支持下,實(shí)現(xiàn)局部本體到全局本體的合成,同時(shí)建立全局本體到局部本體概念、屬性的映射關(guān)系,為后續(xù)的分布式數(shù)據(jù)庫數(shù)據(jù)檢索和查詢提供依據(jù)。
框架的最上層對(duì)應(yīng)智能決策層。利用全局本體和局部本體的映射關(guān)系,實(shí)現(xiàn)故障原因、故障征兆、故障現(xiàn)象和故障類別、設(shè)備結(jié)構(gòu)及其維護(hù)措施的數(shù)據(jù)訓(xùn)練樣本的抽取,采用結(jié)構(gòu)和參數(shù)學(xué)習(xí),結(jié)合專家知識(shí),形成信號(hào)系統(tǒng)維護(hù)決策BN模型,構(gòu)造故障診斷和維護(hù)的智能維護(hù)支持系統(tǒng)。
圖1 高鐵信號(hào)系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護(hù)架構(gòu)
通過異構(gòu)信息的融合,實(shí)現(xiàn)高鐵信號(hào)系統(tǒng)物理數(shù)據(jù)到全局本體的轉(zhuǎn)換,并在全局本體的指導(dǎo)下,實(shí)現(xiàn)概念數(shù)據(jù)的統(tǒng)一、語義沖突的消除和多源信息的統(tǒng)一集成。其主要步驟包括本地關(guān)系數(shù)據(jù)庫到局部RDF(S)的轉(zhuǎn)換,通過基于圖論的方法實(shí)現(xiàn)局部RDF(S)本體到全局本體RDF(S)的融合。
2.1 本地關(guān)系數(shù)據(jù)庫到局部RDF(S)的轉(zhuǎn)換
構(gòu)建局部本體到全局本體的形式化定義是本體轉(zhuǎn)換的嚴(yán)格推理和邏輯驗(yàn)證的保證,同時(shí)也是實(shí)現(xiàn)本體合并的語義一致性、完備性證明中的重要步驟。
下面首先給出關(guān)系數(shù)據(jù)庫、本體圖和關(guān)系數(shù)據(jù)庫的形式化定義。
定義1 一個(gè)關(guān)系數(shù)據(jù)庫模式DBS=(L,PKey,FKey,Attr)是一個(gè)四元組,其中:
(1)L=R∪D為名稱集合,這里R=ET∪RT為表名集合,ET和RT分別為實(shí)體表和關(guān)系表,D為數(shù)據(jù)類型名稱的集合,表示關(guān)系數(shù)據(jù)庫中預(yù)定義的類型名稱;
(2)Attr為屬性集合,?T∈R,T有一個(gè)非空的列集合Attr(T),且?A∈Attr(T)有一個(gè)預(yù)先定義的數(shù)據(jù)類型Type(A)∈D;
(3)?T∈R,T有且僅有一個(gè)主鍵PKey(T)(非空列集合),PKey(T)∈Attr(T)(單鍵,并且T∈ET),或者PKey(T)∈Attr(復(fù)合鍵,并且T∈RT);
(4)?T∈R,T可能有一個(gè)或多個(gè)引用其他實(shí)體表G(G∈ET)主鍵的外鍵FKey(T,G)的列的集合FKey(T,G)∈Attr(T)。
2.2 局部RDF(S)本體到全局本體RDF(S)的融合
分布式數(shù)據(jù)庫的數(shù)據(jù)字段由于在設(shè)計(jì)初期沒有考慮數(shù)據(jù)融合問題,導(dǎo)致局部RDF(S)存在類名和屬性命名沖突。例如,在信號(hào)系統(tǒng)車載維護(hù)數(shù)據(jù)記錄中,頻繁出現(xiàn)“ATP故障”、“ATP故障停車”、“ATPCU故障”、“ATPCU相關(guān)”等數(shù)據(jù)來刻畫ATPCU這一概念。同時(shí),不同的監(jiān)控設(shè)備(如JRU、AElog和DMS等)記錄ATPCU的數(shù)據(jù)字段存在不一致的現(xiàn)象,這直接導(dǎo)致RDF(S)中的術(shù)語不統(tǒng)一甚至沖突。
本文針對(duì)上述問題,借鑒文獻(xiàn)[11-12]提出的RDF(S)合并思路,利用霍爾(Horn)邏輯來刻畫概念和屬性間的等價(jià)、包含或者沖突關(guān)系。例如,將表達(dá)同一概念的“ATP故障”、“ATP故障停車”、“ATPCU故障”之間的關(guān)系用下述Horn等價(jià)邏輯刻畫:
ATP故障?ATP故障停車?ATPCU故障
同時(shí)考慮到高鐵信號(hào)系統(tǒng)數(shù)據(jù)記錄的時(shí)空特征,提出了改進(jìn)的RDF(S)合成算法。算法中考慮了信號(hào)系統(tǒng)維護(hù)記錄中的時(shí)間地點(diǎn)匹配原則,即RDF(S)圖的合并三元組必須滿足時(shí)空匹配,也就是在相同的時(shí)間、地點(diǎn)(如線路站點(diǎn)、電務(wù)段)的前提下進(jìn)行融合。具體的算法如表1所示。
所提算法利用Horn邏輯刻畫異構(gòu)數(shù)據(jù)源的概念和屬性的關(guān)系(參見算法第3行),其中的timeAddrMode表示時(shí)間地點(diǎn)匹配模式,保證所有融合的節(jié)點(diǎn)需要滿足相同的時(shí)空約束。算法第10~13行根據(jù)Horn邏輯描述的不同本體中概念的等價(jià)關(guān)系,計(jì)算強(qiáng)連通圖SCC,完成等價(jià)節(jié)點(diǎn)的合并,實(shí)現(xiàn)包括同物異名節(jié)點(diǎn)等語義沖突的消除,第14~15行消除RDF(S)合并過程中的冗余邊。本體融合算法偽代碼見表1。
表1 本體融合算法偽代碼
3.1 故障數(shù)據(jù)訓(xùn)練矢量的獲取
根據(jù)生成的全局RDF(S)本體和局部RDF(S)本體的映射關(guān)系,構(gòu)建包含故障現(xiàn)象和原因的矢量樣本,其對(duì)應(yīng)同一時(shí)刻、同一地點(diǎn)和設(shè)備故障的所有數(shù)據(jù)庫的監(jiān)控設(shè)備記錄、人員記錄以及維修日志。在信號(hào)系統(tǒng)的故障診斷中,矢量空間中的變量定義如下:DMIMasterFail表示DMI與主機(jī)通信中斷;DMIEquipFail表示DMI報(bào)地面設(shè)備故障;StartRBC表示啟動(dòng)RBC;MT表示車載電臺(tái);SafeTrans表示安全傳輸模塊;Stop表示停車。
需要注意的是:由于記錄設(shè)備或人員的限制,導(dǎo)致數(shù)據(jù)庫中的故障存在記錄缺失的現(xiàn)狀(見表2),這對(duì)后續(xù)的完全數(shù)據(jù)的結(jié)構(gòu)和參數(shù)學(xué)習(xí)設(shè)置了極大的障礙。
表2 高鐵信號(hào)設(shè)備故障記錄表單
注:“缺失“表示沒有對(duì)應(yīng)的數(shù)據(jù)記錄。
3.2 缺失數(shù)據(jù)的智能維護(hù)BN模型
鑒于故障數(shù)據(jù)記錄缺失的現(xiàn)狀和目前存在大量的高鐵信號(hào)系統(tǒng)故障傳播機(jī)理先驗(yàn)知識(shí),本文中采用以專家經(jīng)驗(yàn)BN模型為主,利用結(jié)構(gòu)和參數(shù)學(xué)習(xí)挖掘隱含BN關(guān)系為輔的方式構(gòu)建智能維護(hù)BN模型。下面給出適應(yīng)缺失數(shù)據(jù)下的結(jié)構(gòu)期望最大化(SEM)算法[13-14]的描述。
(1)
式中:Xi為網(wǎng)絡(luò)中節(jié)點(diǎn)變量,∏Xi為其父變量,#(Xi,∏Xi)為貝葉斯網(wǎng)絡(luò)所需要的參數(shù)個(gè)數(shù)。這里BN定義為B=〈G,Θ〉,G為網(wǎng)絡(luò)結(jié)構(gòu),Θ為網(wǎng)絡(luò)參數(shù)。其基本思想:從某一初始貝葉斯網(wǎng)絡(luò)B0=〈G0,Θ0〉出發(fā)開始迭代,在進(jìn)行了t次迭代得到當(dāng)前最佳網(wǎng)絡(luò)Bt=〈Gt,Θt〉后,第t+1次迭代由以下兩步驟組成。
(1)基于當(dāng)前最佳網(wǎng)絡(luò)Bt=〈Gt,Θt〉對(duì)數(shù)據(jù)集D利用EM算法進(jìn)行補(bǔ)全,使之完整并得到完整數(shù)據(jù)集Dt。
(2)基于數(shù)據(jù)集D對(duì)模型及參數(shù)進(jìn)一步優(yōu)化,得到Bt=〈Gt,Θt〉,其中初始網(wǎng)絡(luò)的選擇一般是:隱變量和所有的已觀測(cè)變量都是相連的,并且是它們的父節(jié)點(diǎn)。如果一個(gè)網(wǎng)絡(luò)結(jié)構(gòu)中有很多隱變量,那么就從中隨機(jī)地選擇邊,以確保不會(huì)超過父節(jié)點(diǎn)集的大小,然后按照上述思想進(jìn)行迭代。
參照全局RDF(S)和局部RDF(S)的映射關(guān)系,提取武廣高鐵信號(hào)系統(tǒng)車載設(shè)備、地面監(jiān)控設(shè)備、DMS設(shè)備等多源異構(gòu)信息數(shù)據(jù)庫中數(shù)據(jù)用于BN的結(jié)構(gòu)和參數(shù)學(xué)習(xí),由SEM算法得到的BN結(jié)果如圖2所示。
圖2 基于SEM算法的BN故障模型
由于數(shù)據(jù)結(jié)構(gòu)量較小,所以結(jié)構(gòu)學(xué)習(xí)的結(jié)果并不十分理想,但是在有限的學(xué)習(xí)過程中,我們也可以從中提取到有用的信息。例如:18、19、20三個(gè)節(jié)點(diǎn)的關(guān)聯(lián)(參見圖2中的粗箭頭線)在基于專家知識(shí)的BN故障模型中是缺失的,但是在SEM結(jié)構(gòu)學(xué)習(xí)中挖掘出了專家知識(shí)忽視的隱含關(guān)聯(lián)關(guān)系。
圖2中1~34節(jié)點(diǎn)的具體含義如表3所示。
按照故障傳播機(jī)理,完整的故障因果關(guān)系包括故障現(xiàn)象、故障征兆、故障傳播環(huán)節(jié),這里可以根據(jù)高鐵信號(hào)系統(tǒng)的子系統(tǒng)、設(shè)備和具體部件分為多級(jí)故障,即系統(tǒng)級(jí)故障、子系統(tǒng)級(jí)故障、器件級(jí)故障和最終的故障源。
表3 BN中各節(jié)點(diǎn)所代表的含義
大量的故障分析工具如故障樹、FEMA等方法為建立信號(hào)系統(tǒng)的故障因果關(guān)系的BN提供了支持。鑒于篇幅的限制,本文不再贅述。
3.3 融合先驗(yàn)知識(shí)的故障診斷BN結(jié)構(gòu)
在實(shí)際應(yīng)用中,考慮到先驗(yàn)知識(shí)構(gòu)建的BN的穩(wěn)定性和可靠性,確定以其為主、結(jié)構(gòu)學(xué)習(xí)為輔的策略。利用結(jié)構(gòu)學(xué)習(xí)中發(fā)掘的隱含聯(lián)系對(duì)先驗(yàn)知識(shí)構(gòu)建的BN進(jìn)行補(bǔ)充,當(dāng)出現(xiàn)二者之間的沖突聯(lián)系,應(yīng)該以先驗(yàn)知識(shí)的BN為主。同時(shí),充分考慮結(jié)構(gòu)學(xué)習(xí)的“過擬合”問題,即結(jié)構(gòu)過于復(fù)雜,對(duì)訓(xùn)練樣本達(dá)到非常高的精度,但樣本產(chǎn)生的噪聲會(huì)導(dǎo)致網(wǎng)絡(luò)的泛化能力降低。
圖3為執(zhí)行上述融合原則所得到的最優(yōu)BN結(jié)構(gòu),其中細(xì)線表示基于專家知識(shí)的節(jié)點(diǎn)關(guān)聯(lián)關(guān)系,粗線表示SEM算法挖掘的隱含關(guān)系,因此融合后的模型綜合考慮了先驗(yàn)的故障傳播機(jī)理和經(jīng)過數(shù)據(jù)挖掘后先驗(yàn)知識(shí)無法揭示的隱含故障傳播關(guān)系。
圖3 融合先驗(yàn)知識(shí)和SEM算法的BN故障診斷模型
本文所使用的故障數(shù)據(jù)來自武廣線2011年8月至2012年12月的信號(hào)系統(tǒng)監(jiān)控?cái)?shù)據(jù)。分別對(duì)基于RDF(S)圖的全局RDF(S)的合并算法性能和故障診斷結(jié)果的準(zhǔn)確性進(jìn)行了分析對(duì)比。
4.1 RDF(S)合并算法性能比較
為了說明本文提出的改進(jìn)的RDF(S)合并算法的有效性,將提出的算法與經(jīng)典的閉包本體融合算法進(jìn)行比較。圖4給出了計(jì)算時(shí)間的比較結(jié)果。圖4中計(jì)算了本體節(jié)點(diǎn)在20~980范圍內(nèi)的計(jì)算時(shí)間,可以看出,在較小的節(jié)點(diǎn)數(shù)量下,兩算法具有基本相似的計(jì)算時(shí)間,但隨著節(jié)點(diǎn)數(shù)量的增加,基于閉包算法的計(jì)算時(shí)間遠(yuǎn)高于提出的改進(jìn)算法。這主要是由于前者的計(jì)算復(fù)雜度為指數(shù)級(jí),而提出的改進(jìn)本體融合算法的時(shí)間復(fù)雜度為多項(xiàng)式。
圖4 RDF(S)本體融合運(yùn)行時(shí)間
4.2 基于BN的智能維護(hù)決策模型的性能
根據(jù)全局RDF(S)和局部RDF(S)的映射關(guān)系,提取武廣高鐵信號(hào)系統(tǒng)車載設(shè)備、地面監(jiān)控設(shè)備、DMS設(shè)備等多源異構(gòu)信息數(shù)據(jù)庫中608條數(shù)據(jù)用于BN的結(jié)構(gòu)和參數(shù)學(xué)習(xí),剩余100條用來驗(yàn)證BN的正確性。圖5為故障診斷系統(tǒng)測(cè)試結(jié)果。
圖5 故障診斷系統(tǒng)測(cè)試結(jié)果
由圖5可以看出,一級(jí)故障和二級(jí)故障診斷的平均正確率均為92.4%,三級(jí)故障為67.2%。
在故障診斷過程中,三級(jí)故障中誤診的概率比較大,主要原因是監(jiān)控?cái)?shù)據(jù)缺少大量的細(xì)節(jié)證據(jù)來支持第三級(jí)的故障診斷。如果結(jié)合維修檢測(cè)證據(jù)和日常巡檢和第三級(jí)故障相關(guān)的證據(jù),則診斷的準(zhǔn)確性會(huì)得到較大的提升。
針對(duì)高速鐵路信號(hào)系統(tǒng)的多源異構(gòu)監(jiān)控信息,本文建立了融合異構(gòu)設(shè)備監(jiān)控?cái)?shù)據(jù)的智能維護(hù)決策架構(gòu)。在架構(gòu)中的RDF(S)本體合并部分,根據(jù)監(jiān)控?cái)?shù)據(jù)的時(shí)空配準(zhǔn)原則,提出了改進(jìn)的RDF(S)融合算法,算法具有多項(xiàng)式的計(jì)算復(fù)雜度。針對(duì)高鐵信號(hào)監(jiān)控?cái)?shù)據(jù)的缺失現(xiàn)狀,在智能維護(hù)BN模型部分,結(jié)合結(jié)構(gòu)化期望最大BN學(xué)習(xí)算法和專家知識(shí),提出優(yōu)化的BN維護(hù)決策模型。利用實(shí)際的高鐵監(jiān)控?cái)?shù)據(jù)對(duì)決策模型的測(cè)試,證明了其對(duì)于第一級(jí)和第二級(jí)故障診斷的準(zhǔn)確性。對(duì)于更為細(xì)粒度的判定準(zhǔn)確性,需要進(jìn)一步加強(qiáng)相關(guān)證據(jù)的抽取和測(cè)試,這將是下一步需要解決的關(guān)鍵問題。
[1] ABANDA H, NG’OMBE A, TAH J, et al. An ontology-driven decision support system for land delivery in Zambia [J]. Expert Systems with Applications, 2011, 38(9): 10896-10905.
[2] VERSTICHEL S, ONGENAE F, LOEVE L, et al. Efficient data integration in the railway domain through an ontology-based methodology [J]. Transportation Research: Part C, 2011, 19: 617-643.
[3] SAA R, GARCIA A, GOMEZ C, et al. An ontology-driven decision support system for high-performance and cost-optimized design of complex railway portal frames [J]. Expert Systems with Applications, 2012, 39: 8784-8792.
[4] LIU Z, HUANG L, XU D. Research on semantic retrieval system for high-speed railway knowledge based on ontology [C]∥International Colloquium on Computing, Communication, Control, and Management. Piscataway, USA: IEEE, 2008: 303-307.
[5] 韓春華, 易思蓉, 呂希奎. 基于GIS的鐵路選線智能環(huán)境及領(lǐng)域本體建模方法 [J]. 中國鐵道科學(xué), 2006, 27(6): 84-88. HAN Chunhua, YI Sirong, LV Xikui. GIS based railway location intelligent environment and domain ontology modeling method [J]. China Railway Science, 2006, 27(6): 84-90.
[6] CHOUGULE R, RAJPATHAK D, BANDYOPADHYAY P. An integrated framework for effective service and repair in the automotive domain: an application of association mining and case-based-reasoning [J]. Computers in Industry, 2011, 62: 742-754.
[7] European Commission. European railway open maintenance system. [EB/OL]. [2014-06-30]. http:∥www.transport-research.info/web/projects/project_details.cfm?id=15048.
[8] European Commission. Intelligent integration of railway systems. [DB/OL]. [2014-06-30]. http:∥www.integrail.info/.
[9] FERREIRO S, ARNAIZ A, SIERRA B, et al. Application of Bayesian networks in prognostics for a new Integrated Vehicle Health Management concept [J]. Expert Systems with Applications, 2012, 39(7): 6402-6418.
[10]VONG C, WONG P, IP W. Case-based expert system using wavelet packet transform and kernel-based feature manipulation for engine ignition system [J]. Engineering Applications of Artificial Intelligence, 2011, 24(7): 1281-1294.
[11]UDREA O, DENG Y, RUCKHAUS E, et al. A graph theoretical foundation for integrating RDF ontologies [C]∥Proceedings of the Twentieth National Conference on Artificial Intelligence. Pittsburgh, Pennsylvania, USA: AAAI, 2005: 1442-1447.
[12]HOU X, OON S K, NEE A Y C, et al. A graph-based approach for automatic construction of domain ontology [J]. Expert Systems with Applications, 2011, 38: 11958-11975.
[13]FRIEDMAN N. Learning belief networks in the presence of missing values and hidden variables [C]∥Proceedings of the Fourteenth International Conference on Machine Learning. San Francisco, USA: ADM, 1997: 125-133.
[14]NIELSEN J D, RUMR, SALMERN A. Structural-EM for learning PDG models from incomplete data [J]. International Journal of Approximate Reasoning, 2010, 51: 515-530.
[本刊相關(guān)文獻(xiàn)鏈接]
杜曉林,蘇濤,朱文濤,等.一種多輸入多輸出雷達(dá)相位編碼信號(hào)的設(shè)計(jì)方法.2014,48(12):93-99.[doi:10.7652/xjtuxb 201412015]
尚佳棟,王祖林,周麗娜,等.采用隨機(jī)共振增強(qiáng)的混合擴(kuò)頻信號(hào)跳頻參數(shù)估計(jì).2014,48(10):42-48.[doi:10.7652/xjtuxb201410007]
李實(shí)鋒,王玉林,華宇,等.羅蘭擬C信號(hào)的抗干擾快速檢測(cè)方法.2013,47(10):91-96.[doi:10.7652/xjtuxb201310016]
陳曉光,徐光華,梁霖,等.一種電流弱信號(hào)特征提取方法.2013,47(9):83-87.[doi:10.7652/xjtuxb201309014]
刁瑞朋,孟慶豐.一種衰減信號(hào)加窗頻域插值算法.2013,47(7):85-90.[doi:10.7652/xjtuxb201307016]
齊巍,陸明泉,李強(qiáng),等.高動(dòng)態(tài)測(cè)量系統(tǒng)中的自適應(yīng)信號(hào)成形濾波器設(shè)計(jì).2013,47(6):124-129.[doi:10.7652/xjtuxb 201306021]
謝楨,付立軍,肖飛,等.三電平直流變換器全模式小信號(hào)建模和控制器設(shè)計(jì).2013,47(6):109-116.[doi:10.7652/xjtuxb201306019]
鄭紀(jì)彬,任愛鋒,蘇濤,等.多分量Chirp信號(hào)相位參數(shù)的精確估計(jì)算法.2013,47(2):69-74.[doi:10.7652/xjtuxb2013 02012]
謝航,廖與禾,林京.一種含噪聲多模態(tài)調(diào)頻調(diào)幅信號(hào)的提取方法.2012,46(7):93-97.[doi:10.7652/xjtuxb201207017]
朱軍濤,廖紅建,謝勇勇,等.采用短時(shí)傅里葉變換的鐵路車載探地雷達(dá)數(shù)據(jù)解譯方法.2012,46(7):108-114.[doi:10.7652/xjtuxb201207020]
(編輯 荊樹蓉)
Heterogeneous Data Fusion and Intelligent Maintenance Decision for High Speed Railway Signaling Systems
XU Tianhua1,YANG Lianbao1,HU Hongli2,WANG Xiaoxin2
(1. State Key Laboratory of Rail Traffic Control and Safety, Beijing Jiaotong University, Beijing 100044, China; 2. State Key Laboratory of Electrical Insulation and Power Equipment, Xi’an Jiaotong University, Xi’an 710049, China)
A framework of integrated heterogeneous data and intelligent maintenance decision was proposed aiming at the multi-source heterogeneous data in intelligent maintenance decision for railway signaling systems. By means of transformation and fusion from local resource description framework (schema)(RDF(S)) to global RDF(S), the fusion of heterogeneous data was realized. In addition, a Bayesian net (BN) based intelligent maintenance decision model was constructed by combing the structural expectation maximum (SEM) algorithm for missing data with the expert knowledge. The correctness and efficiency of the proposed framework and the RDF(S) fusion algorithm were verified by the maintenance data from Wuhan-Guangzhou high-speed railway signaling systems in 2011-2012. The experimental results show that the computational complexity of the proposed ontology fusion algorithm is polynomial, and the average accuracy of the fault diagnosis for the first level reaches 92.4%. Therefore, the proposed framework may improve the accuracy and efficiency of the intelligent maintenance decision of high-speed railway systems.
high-speed railway; signaling system; heterogeneous data; ontology fusion
2014-07-21。
徐田華(1971—),男,副教授。
國家自然科學(xué)基金資助項(xiàng)目(51305021);鐵路總公司重點(diǎn)資助項(xiàng)目(2013X015-B);軌道交通控制與安全國家重點(diǎn)實(shí)驗(yàn)室自主研究課題(RCS2012ZT005)。
時(shí)間:2014-10-15
10.7652/xjtuxb201501012
TM934
A
0253-987X(2015)01-0072-07
網(wǎng)絡(luò)出版地址:http:∥www.cnki.net/kcms/detail/61.1069.T.20141015.1752.006.html