韓智+周法國(guó)
摘 要: 為了解決高鐵機(jī)車(chē)設(shè)備運(yùn)行數(shù)據(jù)的獨(dú)立采集與分析造成大量數(shù)據(jù)冗余以及數(shù)據(jù)結(jié)構(gòu)不一致、多源異構(gòu)數(shù)據(jù)不能融合等問(wèn)題。探索高鐵動(dòng)車(chē)行業(yè)知識(shí)圖譜的自動(dòng)化構(gòu)建過(guò)程以及本體和知識(shí)圖譜之間映射匹配機(jī)制,采用本體建模語(yǔ)言O(shè)WL,對(duì)高速鐵路列車(chē)設(shè)備檢測(cè)系統(tǒng)的上位機(jī)進(jìn)行本體建模。實(shí)踐證明高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)中本體框架的智能化維護(hù)是保證系統(tǒng)能正常運(yùn)行的關(guān)鍵,利用本體技術(shù)和知識(shí)圖譜解決數(shù)據(jù)異構(gòu)和數(shù)據(jù)冗余的問(wèn)題以及對(duì)車(chē)輛檢測(cè)設(shè)備平臺(tái)進(jìn)行智能化本體維護(hù)。
關(guān)鍵詞: 高鐵動(dòng)車(chē); 本體; 多源異構(gòu)數(shù)據(jù); 知識(shí)圖譜; 設(shè)備檢測(cè)系統(tǒng); 智能化維護(hù)
中圖分類(lèi)號(hào): TN911.23?34 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2018)06?0011?04
Abstract: The operating data independent collection and analysis of high?speed train′s equipment have the problems of massive data redundancy and inconsistent data structure, and can′t fuse the multi?source heterogeneous data. The automatic construction process of the knowledge mapping of the high?speed rail industry and mapping matching mechanism between ontology and knowledge mapping are explored. The OWL is used to model the ontology of the host computer of the high?speed train′s equipment detection system. The practice results prove that the intelligent maintenance for ontology framework of high?speed train′s equipment detection system is the key to guarantee the normal operation of the system. The ontology technology and knowledge mapping can solve the problems of data heterogeneity and data redundancy, and perform the intelligent ontology maintenance for the vehicle′s equipment detection platform.
Keywords: high?speed train; ontology; multi?source heterogeneous data; knowledge mapping; equipment detection system; intelligent maintenance
0 引 言
高鐵動(dòng)車(chē)上的車(chē)載設(shè)備,比如牽引設(shè)備、制動(dòng)設(shè)備等,是機(jī)車(chē)行駛控制的重要部件,對(duì)機(jī)車(chē)行駛安全、實(shí)時(shí)狀況的檢測(cè)具有關(guān)鍵作用。如何檢測(cè)設(shè)備故障、實(shí)時(shí)監(jiān)測(cè)列車(chē)運(yùn)行狀態(tài)以及在多源異構(gòu)數(shù)據(jù)中實(shí)現(xiàn)智能化本體維護(hù),是適應(yīng)高鐵動(dòng)車(chē)信息化發(fā)展的關(guān)鍵[1]。目前,高鐵動(dòng)車(chē)上機(jī)車(chē)設(shè)備運(yùn)行數(shù)據(jù)由各個(gè)單元檢測(cè)系統(tǒng)獨(dú)立地采集與分析,造成大量數(shù)據(jù)冗余和數(shù)據(jù)結(jié)構(gòu)不一致,所以需要解決機(jī)車(chē)設(shè)備各個(gè)系統(tǒng)單元缺乏統(tǒng)一的系統(tǒng)應(yīng)用平臺(tái)這一關(guān)鍵制約,以解決機(jī)車(chē)運(yùn)行中數(shù)據(jù)冗余和數(shù)據(jù)異構(gòu)問(wèn)題。隨著本體技術(shù)和知識(shí)圖譜的應(yīng)用為解決數(shù)據(jù)異構(gòu)和數(shù)據(jù)冗余問(wèn)題提供了可能。
本體技術(shù)是指針對(duì)事物的本身給出構(gòu)成相關(guān)領(lǐng)域詞匯的關(guān)系和規(guī)則集合。而知識(shí)圖譜是描述真實(shí)世界中存在的各種實(shí)體、關(guān)系、理論,以及相互之間的關(guān)系。國(guó)內(nèi)外專(zhuān)家學(xué)者在異構(gòu)數(shù)據(jù)融合和防止數(shù)據(jù)大量冗余進(jìn)行了大量的有益探索,歐洲FP5?IST Project就采用本體技術(shù)構(gòu)建異構(gòu)數(shù)據(jù)標(biāo)準(zhǔn)化文檔,實(shí)現(xiàn)數(shù)據(jù)共享,進(jìn)而建立保護(hù)歐洲鐵路系統(tǒng)的處理方法。
借鑒國(guó)內(nèi)外鐵路系統(tǒng)應(yīng)用本體技術(shù)和知識(shí)圖譜的經(jīng)驗(yàn),將機(jī)車(chē)各子系統(tǒng),集成到統(tǒng)一的用戶(hù)平臺(tái),該平臺(tái)框架采用統(tǒng)一的設(shè)計(jì)模式、數(shù)據(jù)存儲(chǔ)方式和接口通信協(xié)議,采用本體建模語(yǔ)言(OWL),構(gòu)建一種基于知識(shí)圖譜表示知識(shí)本體的高鐵設(shè)備檢測(cè)系統(tǒng)平臺(tái)框架,對(duì)機(jī)車(chē)車(chē)載設(shè)備檢測(cè)系統(tǒng)進(jìn)行智能化本體框架構(gòu)建與維護(hù)[2?3]。
1 本體技術(shù)和知識(shí)圖譜
1.1 本體和知識(shí)圖譜
本體,是指事物的本身。近年來(lái),隨著“共享”概念的廣泛提及,本體概念也被“共享”了,比較認(rèn)可的定義是斯坦福大學(xué)的Gruber提出來(lái)的,即“本體是共享概模型的形式化規(guī)范說(shuō)明”[4?5]。
知識(shí)圖譜是在語(yǔ)義Web數(shù)據(jù)源的數(shù)量激增、大量RDF數(shù)據(jù)被發(fā)布的大背景下,于2012年5月,由Google提出這一概念[6?7]。知識(shí)圖譜是表示真實(shí)世界里存在的各種實(shí)體、關(guān)聯(lián)、理論和相互之間的關(guān)系[8]。知識(shí)圖譜可以分為通用知識(shí)圖譜和行業(yè)知識(shí)圖譜。
1.2 知識(shí)圖譜與本體的關(guān)系[6]
知識(shí)圖譜在本體的根本上進(jìn)行展開(kāi)及擴(kuò)大,擴(kuò)大關(guān)鍵表現(xiàn)在實(shí)體層面:本體里突出與強(qiáng)調(diào)的是概念及概念間的相關(guān)性,而知識(shí)圖譜則在本體的根本上,添加了更多的有關(guān)實(shí)體的內(nèi)在信息。模式是對(duì)知識(shí)的提煉,而且按照預(yù)先設(shè)定的形式有助于知識(shí)標(biāo)準(zhǔn)化,更方便查詢(xún)等后續(xù)治理。本體其實(shí)是表示了知識(shí)圖譜的數(shù)據(jù)形式,本質(zhì)上是組建本體。本體是基于概念層次上面的體現(xiàn),對(duì)知識(shí)進(jìn)行抽象化表示,側(cè)重概念和概念間的關(guān)聯(lián);而知識(shí)圖譜以實(shí)體為重心,關(guān)注實(shí)體本身間的關(guān)聯(lián)推理,對(duì)知識(shí)形象化的表示[9]。endprint
2 高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)的本體模型架構(gòu)
高鐵動(dòng)車(chē)在運(yùn)行結(jié)束后,檢測(cè)系統(tǒng)要采集各種行車(chē)參數(shù),對(duì)機(jī)車(chē)整體運(yùn)行狀況進(jìn)行檢測(cè),以確保列車(chē)行車(chē)安全。檢測(cè)系統(tǒng)平臺(tái)主要包括CCU(中央控制單元)、BCU(制動(dòng)自動(dòng)控制單元)、TCU(牽引控制單元)、ACU(輔助控制單元)等子系統(tǒng)。
目前列車(chē)各種檢測(cè)系統(tǒng)主要采用分布式結(jié)構(gòu),各主要檢測(cè)單元是獨(dú)立采集數(shù)據(jù)、獨(dú)立進(jìn)行故障檢測(cè)分析,所以需要多次重復(fù)采集數(shù)據(jù),造成數(shù)據(jù)大量冗余。同時(shí),因?yàn)楦鱾€(gè)檢測(cè)系統(tǒng)之間對(duì)數(shù)據(jù)類(lèi)型表示的不一致,從而無(wú)法有效地進(jìn)行數(shù)據(jù)共享和列車(chē)運(yùn)行狀況的整體分析。為了解決這一問(wèn)題,構(gòu)建統(tǒng)一的檢測(cè)系統(tǒng)平臺(tái),便于各個(gè)檢測(cè)單元間數(shù)據(jù)共享,兼容之前各個(gè)子系統(tǒng)的軟件功能,并考慮到未來(lái)新的軟件功能設(shè)計(jì)添加,所以系統(tǒng)基本框架采用本體模型進(jìn)行構(gòu)建,利用模塊化動(dòng)態(tài)設(shè)計(jì)思想,通過(guò)智能化配置動(dòng)態(tài)生成新的應(yīng)用系統(tǒng),以實(shí)現(xiàn)知識(shí)共享和多源異構(gòu)數(shù)據(jù)融合[10]。系統(tǒng)的總體模型架構(gòu)如圖1所示。
系統(tǒng)框架從靜態(tài)資源描述和動(dòng)態(tài)運(yùn)作機(jī)制兩個(gè)方面進(jìn)行本體建模,所以本體模型框架的描述有兩個(gè)方面[11]:
1) 數(shù)據(jù)的靜態(tài)本體模型以及系統(tǒng)框架中各個(gè)單元的數(shù)據(jù)的靜態(tài)語(yǔ)義表達(dá),實(shí)現(xiàn)不同應(yīng)用之間的數(shù)據(jù)融合。
2) 對(duì)系統(tǒng)的數(shù)據(jù)協(xié)議處理過(guò)程建立動(dòng)態(tài)語(yǔ)義模型,對(duì)知識(shí)的故障識(shí)別、匹配、執(zhí)行等過(guò)程進(jìn)行動(dòng)態(tài)語(yǔ)義描述。
高鐵設(shè)備檢測(cè)系統(tǒng)的本體模型架構(gòu)采用面向服務(wù)架構(gòu),并且該本體框架獨(dú)立于各具體的單元應(yīng)用,將檢測(cè)系統(tǒng)分層建模,然后每層再定義相應(yīng)的內(nèi)容,從而對(duì)高鐵設(shè)備檢測(cè)系統(tǒng)進(jìn)行豐富的層次化描述和層次化本體模型構(gòu)建。其層次化本體框架如圖2所示。
1) 數(shù)據(jù)服務(wù)層:統(tǒng)一數(shù)據(jù)訪問(wèn)接口,實(shí)現(xiàn)數(shù)據(jù)融合,提高框架的通用性。
2) 本體元素層:將系統(tǒng)內(nèi)知識(shí)用本體元素進(jìn)行描述,并接收來(lái)自數(shù)據(jù)服務(wù)層的數(shù)據(jù)。
3) 本體邏輯層:利用通用模塊和專(zhuān)用模塊的動(dòng)態(tài)運(yùn)行機(jī)制,推理出需要的知識(shí)本體。
4) 適配插件層:根據(jù)本體框架動(dòng)態(tài)運(yùn)行機(jī)制,將傳上來(lái)的數(shù)據(jù)與各功能插件進(jìn)行適配,然后將適配結(jié)果上傳應(yīng)用交互層。
5) 應(yīng)用交互層:用戶(hù)在該層對(duì)各類(lèi)任務(wù)進(jìn)行分類(lèi)整合,對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)分析,對(duì)列車(chē)設(shè)備故障、運(yùn)行狀態(tài)進(jìn)行整體分析。
高鐵設(shè)備檢測(cè)系統(tǒng)的本體構(gòu)建是一個(gè)比較復(fù)雜的過(guò)程,需要理清各種應(yīng)用單元實(shí)體間的層次關(guān)系、邏輯關(guān)系等,并且還要使計(jì)算機(jī)能夠識(shí)別和進(jìn)行推理。為了實(shí)現(xiàn)高鐵設(shè)備檢測(cè)系統(tǒng)的本體構(gòu)建、計(jì)算機(jī)自動(dòng)推理及后續(xù)本體框架智能化維護(hù),利用各自本體的映射機(jī)制,對(duì)系統(tǒng)整體的本體框架進(jìn)行抽象化的概念描述。
3 高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)的知識(shí)圖譜構(gòu)建
構(gòu)建該檢測(cè)系統(tǒng)的知識(shí)圖譜,首先要確定清晰的本體與知識(shí)圖譜映射匹配機(jī)制,然后形象化地構(gòu)建該檢測(cè)系統(tǒng)的知識(shí)圖譜。本體實(shí)質(zhì)上是將關(guān)系、實(shí)體等進(jìn)行層次化的抽象表達(dá)。因?yàn)橹R(shí)圖譜相當(dāng)于一張巨大的語(yǔ)義網(wǎng),其中的概念層次關(guān)系可以用樹(shù)來(lái)表示,實(shí)體關(guān)系可以繼續(xù)用圖來(lái)表示,概念節(jié)點(diǎn)作為樹(shù)的節(jié)點(diǎn),實(shí)體節(jié)點(diǎn)可以作為圖的節(jié)點(diǎn),相互間關(guān)聯(lián)線表達(dá)。因此知識(shí)圖譜和本體映射配合模式能當(dāng)作樹(shù)和樹(shù)、樹(shù)和圖的映射。
檢測(cè)系統(tǒng)的本體與知識(shí)圖譜映射匹配機(jī)制如圖3所示。
根據(jù)映射匹配機(jī)制進(jìn)行高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)的知識(shí)圖譜構(gòu)建,圖4為具體的構(gòu)建過(guò)程。
因?yàn)橐紤]車(chē)載設(shè)備中數(shù)據(jù)的多源異構(gòu)、融合、關(guān)鍵信息快速抽取等問(wèn)題,所以,該檢測(cè)系統(tǒng)的知識(shí)圖譜的構(gòu)建過(guò)程是比較復(fù)雜的。需要自底向上,從底層數(shù)據(jù)庫(kù)、全局本體數(shù)據(jù)庫(kù)等進(jìn)行整體的知識(shí)圖譜構(gòu)建。
4 系統(tǒng)平臺(tái)本體框架的智能化維護(hù)檢測(cè)
該高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)的知識(shí)圖譜是以本體庫(kù)為基礎(chǔ),在高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)的本體架構(gòu)應(yīng)用平臺(tái)上構(gòu)建的。所以,高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)中本體框架的智能化維護(hù)依然是保證系統(tǒng)能正常運(yùn)行的關(guān)鍵,其中包括根類(lèi)、子類(lèi)以及實(shí)體的維護(hù),類(lèi)屬性的管理等。
4.1 根類(lèi)維護(hù)
高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)的根類(lèi)分為兩大類(lèi),包括模塊和單元應(yīng)用兩塊,也可根據(jù)實(shí)際情況定義通用模塊和專(zhuān)用模塊。主要功能包括編輯根類(lèi)、刪除根類(lèi)等。具體如表1所示。
4.2 子類(lèi)維護(hù)
子類(lèi)維護(hù)與根類(lèi)操作相同,只是從根類(lèi)繼承了根類(lèi)的屬性和屬性默認(rèn)值,對(duì)于具有相同操作的模塊具有相同屬性,同時(shí)子類(lèi)也可以建立私有屬性。高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)中應(yīng)用模塊需要特殊操作模塊時(shí),可在通用模塊下建立子類(lèi)模塊,并建立私有屬性。主要包括編輯子類(lèi)、刪除子類(lèi)等,具體如表2所示。
4.3 實(shí)體維護(hù)
實(shí)體是將類(lèi)實(shí)體化,類(lèi)中定義有屬性和關(guān)系,實(shí)體依據(jù)這些類(lèi)屬性和關(guān)系建立屬性值和實(shí)體關(guān)系。實(shí)體維護(hù)的主要功能包括增加實(shí)體、刪除實(shí)體等,具體如表3所示。
5 結(jié) 語(yǔ)
本文通過(guò)本體與知識(shí)圖譜的聯(lián)系與映射匹配機(jī)制,探索構(gòu)建一種基于知識(shí)圖譜的高鐵動(dòng)車(chē)設(shè)備檢測(cè)系統(tǒng)的本體框架模型,在系統(tǒng)中引入一些新概念和新方法,解決多源異構(gòu)數(shù)據(jù)快速融合問(wèn)題,使列車(chē)故障診斷和處置率有效提高。并進(jìn)一步探索本體框架、行業(yè)知識(shí)圖譜在高鐵動(dòng)車(chē)領(lǐng)域的深入應(yīng)用。需要指出的是,本體建模工具仍需不斷完善,下一步應(yīng)該是朝著自動(dòng)化、智能化方向發(fā)展,進(jìn)一步補(bǔ)充和完善已有的高鐵列車(chē)設(shè)備的本體庫(kù),構(gòu)建適合于高鐵列車(chē)設(shè)備檢測(cè)系統(tǒng)的領(lǐng)域本體和行業(yè)知識(shí)圖譜,結(jié)合最新的人工智能技術(shù),探索知識(shí)圖譜的自動(dòng)構(gòu)建機(jī)制。
注:本文通訊作者為周法國(guó)。
參考文獻(xiàn)endprint
[1] 韓春華.基于GIS的鐵路選線系統(tǒng)智能環(huán)境建模方法研究[D].成都:西南交通大學(xué),2008.
HAN Chunhua. Research on intelligent environment modeling method of railway route selection system based on GIS [D]. Chengdu: Southwest Jiaotong University, 2008.
[2] YANG Lianbao, LI Ping. Ontology?based decision tree model for intelligent maintenance of high?speed railway onboard equipment [J]. Railway transport and economy, 2017, 39(2): 55?59.
[3] 徐田華,楊連報(bào),胡紅利,等.高速鐵路信號(hào)系統(tǒng)異構(gòu)數(shù)據(jù)融合和智能維護(hù)決策[J].西安交通大學(xué)學(xué)報(bào),2015,49(1):72?78.
XU Tianhua, YANG Lianbao, HU Hongli, et al. Heterogeneous data fusion and intelligent maintenance decision for high speed railway signaling systems [J]. Journal of Xian Jiaotong University, 2015, 49(1): 72?78.
[4] 丘威,張立臣.本體語(yǔ)言研究綜述[J].情報(bào)雜志,2006(7):61?64.
QIU Wei, ZHANG Lichen. Research on ontology language [J]. Journal of information, 2006(7): 61?64.
[5] 王宇華,印桂生.基于本體的需求模型到UML模型轉(zhuǎn)換方法[J].哈爾濱工程大學(xué)學(xué)報(bào),2012,33(6):735?740.
WANG Yuhua, YIN Guisheng. Automatically generating a UML model from a requirement model based on ontology [J]. Journal of Harbin Engineering University, 2012, 33(6): 735?740.
[6] 張德政,謝永紅,李曼,等.基于本體的中醫(yī)知識(shí)圖譜構(gòu)建[J].情報(bào)工程,2017,3(1):35?42.
ZHANG Dezheng, XIE Yonghong, LI Man, et al. Construction of knowledge graph of traditional Chinese medicine based on the ontology [J]. Technology intelligence engineering, 2017, 3(1): 35?42.
[7] 劉嶠,李楊,段宏,等.知識(shí)圖譜構(gòu)建技術(shù)綜述[J].計(jì)算機(jī)研究與發(fā)展,2016,53(3):582?600.
LIU Qiao, LI Yang, DUAN Hong, et al. Knowledge graph construction techniques [J]. Journal of computer research and development, 2016, 53(3): 582?600.
[8] 吳運(yùn)兵,陰愛(ài)英,林開(kāi)標(biāo),等.基于多數(shù)據(jù)源的知識(shí)圖譜構(gòu)建方法研究[J].福州大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,45(3):329?335.
WU Yunbing, YIN Aiying, LIN Kaibiao, et al. Knowledge graph construction method based on multiple data sources [J]. Journal of Fuzhou University (Natural science edition), 2017, 45(3): 329?335.
[9] 胡芳槐.基于多種數(shù)據(jù)源的中文知識(shí)圖譜構(gòu)建方法研究[D].上海:華東理工大學(xué),2015.
HU Fanghuai. Research on construction method of Chinese knowledge atlas based on multiple data sources [D]. Shanghai: East China University of Science and Technology, 2015.
[10] 陳圣青.基于本體的知識(shí)發(fā)現(xiàn)系統(tǒng)框架研究[D].南京:南京航空航天大學(xué),2009.
CHEN Shengqing. Research on ontology based knowledge discovery system framework [D]. Nanjing: Nanjing University of Aeronautics & Astronautics, 2009.
[11] 韓春華,易思蓉,呂希奎.基于GIS的鐵路選線智能環(huán)境及領(lǐng)域本體建模方法[J].中國(guó)鐵道科學(xué),2006,27(6):84?88.
HAN Chunhua, YI Sirong, L? Xikui. GIS based railway location intelligent environment and domain ontology modeling method [J]. China railway science, 2006, 27(6): 84?88.endprint