李超旭,張惟皎,李 燕
(1.中國鐵道科學(xué)研究院?研究生部,北京?100081;2.中國鐵道科學(xué)研究院集團有限公司?電子計算?技術(shù)研究所,北京?100081)
隨著動車組運力不斷增加、管理逐步深入,動車組管理信息系統(tǒng)及相應(yīng)配套系統(tǒng)的建設(shè)和應(yīng)用,配屬、計劃、履歷、故障、大部件等關(guān)鍵業(yè)務(wù)的流程已逐漸標(biāo)準(zhǔn)化、日?;?,高效穩(wěn)定的信息化生產(chǎn)管理方式在動車組運用檢修工作中發(fā)揮著舉足輕重的作用。在鐵路加快信息化發(fā)展的新形勢下[1],動車組信息系統(tǒng)體量的不斷增加,其相應(yīng)產(chǎn)生的數(shù)據(jù)也在呈指數(shù)形式增長,由于目前還沒有針對動車組運維數(shù)據(jù)服務(wù)平臺建設(shè)方面的研究成果,傳統(tǒng)數(shù)據(jù)處理方式應(yīng)對大體量多類型數(shù)據(jù)的不足造成了現(xiàn)有系統(tǒng)應(yīng)用查詢響應(yīng)慢,跨業(yè)務(wù)域綜合應(yīng)用支撐差,基礎(chǔ)字典表及關(guān)鍵業(yè)務(wù)表數(shù)據(jù)不標(biāo)準(zhǔn)、不規(guī)范,系統(tǒng)間接口管理不統(tǒng)一等一系列亟待解決的問題。
大數(shù)據(jù)技術(shù)的快速崛起為海量多源異構(gòu)數(shù)據(jù)的處理提供了一種快速高效機制[2]。針對各動車組信息系統(tǒng)各自建設(shè),獨立工作,數(shù)據(jù)資源共享程度低,數(shù)據(jù)集成度弱所造成的基礎(chǔ)數(shù)據(jù)多頭維護,缺乏統(tǒng)一管理的現(xiàn)狀[3],動車組運維數(shù)據(jù)服務(wù)平臺應(yīng)用大數(shù)據(jù)、流式計算、云計算等技術(shù),進行數(shù)據(jù)資源整合,結(jié)合數(shù)據(jù)規(guī)范和接口規(guī)范實現(xiàn)對外統(tǒng)一提供數(shù)據(jù)服務(wù)。從而保障全路各類動車組運用檢修數(shù)據(jù)一致性和完備性,實現(xiàn)動車組運維過程的全面掌控,為動車組故障預(yù)測與健康管理(PHM)、運行狀態(tài)監(jiān)控、運維效率提高、大部件維修保養(yǎng)提供輔助決策支持[4]。
動車組運維數(shù)據(jù)服務(wù)平臺通過整合相關(guān)系統(tǒng)數(shù)據(jù),規(guī)范數(shù)據(jù)內(nèi)容,提高數(shù)據(jù)質(zhì)量,為監(jiān)管類和統(tǒng)計、分析類應(yīng)用提供數(shù)據(jù)支持。總體架構(gòu)設(shè)計依據(jù)可重用性、安全性、高可用性、可管理性、可擴展性的設(shè)計原則,采取總體規(guī)劃分級實現(xiàn)的方式完成。動車運維數(shù)據(jù)服務(wù)平臺分中國國家鐵路集團有限公司(以下簡稱“國鐵集團”)級與鐵路局集團公司級兩級平臺,通過相同數(shù)據(jù)架構(gòu)統(tǒng)一搭建,依托鐵路內(nèi)部服務(wù)網(wǎng)進行數(shù)據(jù)傳輸,匯集動車組相關(guān)信息系統(tǒng)中配屬、履歷、檢修作業(yè)計劃、故障等內(nèi)部系統(tǒng)數(shù)據(jù)和動車組高級修作業(yè)設(shè)備數(shù)據(jù)等外部系統(tǒng)數(shù)據(jù),支撐鐵路系統(tǒng)內(nèi)各層級動車組運維數(shù)據(jù)全面應(yīng)用,實現(xiàn)動車組運維數(shù)據(jù)共享最大化。動車組運維數(shù)據(jù)服務(wù)平臺總體架構(gòu)如圖1所示。
圖1 動車組運維數(shù)據(jù)服務(wù)平臺總體架構(gòu)Fig.1 Overall architecture of EMU operation and maintenance data service platform
結(jié)合動車組運維數(shù)據(jù)服務(wù)平臺總體架構(gòu),動車組運維數(shù)據(jù)服務(wù)平臺邏輯架構(gòu)分為數(shù)據(jù)源層、數(shù)據(jù)采集層、數(shù)據(jù)管理層、數(shù)據(jù)分析層、數(shù)據(jù)應(yīng)用層、標(biāo)準(zhǔn)規(guī)范體系及安全體系[5]。各層之間以數(shù)據(jù)流為驅(qū)動,密切聯(lián)系,相互協(xié)作,實現(xiàn)動車組運維數(shù)據(jù)服務(wù)平臺數(shù)據(jù)的采集、加工、分析與應(yīng)用。動車組運維數(shù)據(jù)服務(wù)平臺邏輯架構(gòu)如圖2所示。
(1)數(shù)據(jù)源層。數(shù)據(jù)源層確定了動車組運維數(shù)據(jù)服務(wù)平臺中的數(shù)據(jù)范圍,主要包括由動車運用所、檢修基地、主機廠、配件供應(yīng)商4個數(shù)據(jù)落地區(qū)內(nèi)部系統(tǒng)與第三方系統(tǒng)產(chǎn)生的動車組運維相關(guān)數(shù)據(jù)。
(2)數(shù)據(jù)采集層。數(shù)據(jù)采集層為貼源數(shù)據(jù)層,即數(shù)據(jù)采集層內(nèi)數(shù)據(jù)格式與內(nèi)容均與數(shù)據(jù)源層系統(tǒng)數(shù)據(jù)保持一致,利用ETL (Extract-Transform-Load)工具,根據(jù)數(shù)據(jù)更新特點制定抽取策略,將數(shù)據(jù)源層系統(tǒng)中結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)抽取至數(shù)據(jù)采集層[6]。同時數(shù)據(jù)采集層中架設(shè)數(shù)據(jù)緩沖區(qū),保證數(shù)據(jù)抽取效率與可靠性。
(3)數(shù)據(jù)管理層。數(shù)據(jù)管理層包含數(shù)據(jù)處理與數(shù)據(jù)治理2部分,數(shù)據(jù)處理主要完成實時數(shù)據(jù)的查詢、計算與離線數(shù)據(jù)的清洗、轉(zhuǎn)換、整合、匯總。通過數(shù)據(jù)處理消除數(shù)據(jù)冗余,糾正數(shù)據(jù)錯誤,結(jié)合數(shù)據(jù)治理實現(xiàn)數(shù)據(jù)的規(guī)范、稽核與管理。
(4)數(shù)據(jù)分析層。通過利用Hadoop分析組件結(jié)合相關(guān)分析算法實現(xiàn)大數(shù)據(jù)分析功能,運用神經(jīng)網(wǎng)絡(luò)、深度學(xué)習(xí)等機器學(xué)習(xí)技術(shù),研究動車組相關(guān)模型,并將已有的數(shù)據(jù)作為模型訓(xùn)練樣本,通過大量訓(xùn)練學(xué)習(xí)不斷優(yōu)化模型,為數(shù)據(jù)應(yīng)用提供分析服務(wù)。
(5)數(shù)據(jù)應(yīng)用層。結(jié)合用戶應(yīng)用需求,將平臺功能通過封裝以接口服務(wù)形式發(fā)布,為用戶提供基于大數(shù)據(jù)的數(shù)據(jù)處理、分析服務(wù),還可支撐動車組PHM、統(tǒng)計分析、數(shù)據(jù)可視化、動車組綜合監(jiān)控、智能運維等相關(guān)數(shù)據(jù)需求。
(6)標(biāo)準(zhǔn)規(guī)范體系。標(biāo)準(zhǔn)規(guī)范體系作為數(shù)據(jù)規(guī)范化的前提,數(shù)據(jù)處理的標(biāo)準(zhǔn)依據(jù),貫穿動車組運維數(shù)據(jù)服務(wù)平臺構(gòu)建全流程,保證動車組相關(guān)業(yè)務(wù)系統(tǒng)間數(shù)據(jù)的一致性和標(biāo)準(zhǔn)性,打通不同業(yè)務(wù)系統(tǒng)間的數(shù)據(jù)壁壘,實現(xiàn)不同系統(tǒng)間數(shù)據(jù)共享。
(7)安全體系。構(gòu)建健全的數(shù)據(jù)傳輸、用戶認證、權(quán)限認證等安全體系保障動車組運維數(shù)據(jù)服務(wù)平臺的安全平穩(wěn)運行。
結(jié)合動車組運維數(shù)據(jù)服務(wù)平臺總體架構(gòu)與邏輯架構(gòu),動車組運維數(shù)據(jù)服務(wù)平臺功能架構(gòu)應(yīng)該滿足數(shù)據(jù)處理功能與特定需求,分為系統(tǒng)管理、安全管理、元數(shù)據(jù)管理、數(shù)據(jù)處理、數(shù)據(jù)存儲、數(shù)據(jù)分析、功能應(yīng)用7個模塊。動車組運維數(shù)據(jù)服務(wù)平臺功能架構(gòu)如圖3所示。
(1)系統(tǒng)管理。合理的權(quán)限分配與系統(tǒng)狀態(tài)的實時監(jiān)控是動車組運維數(shù)據(jù)服務(wù)平臺平穩(wěn)運行的前提,系統(tǒng)管理提供完整的用戶權(quán)限管理與任務(wù)調(diào)度機制。通過系統(tǒng)管理可實現(xiàn)系統(tǒng)運行狀態(tài)的實時監(jiān)控、系統(tǒng)配置與日志管理等系統(tǒng)功能。
(2)安全管控。安全管控模塊是動車組運維數(shù)據(jù)服務(wù)平臺的安全保障體系,主要通過身份驗證控制接口與用戶的接入、訪問,實現(xiàn)平臺內(nèi)外接口安全管控,數(shù)據(jù)加密、數(shù)據(jù)校驗等安全措施保證數(shù)據(jù)傳輸?shù)陌踩浴?/p>
(3)元數(shù)據(jù)管理。元數(shù)據(jù)管理是數(shù)據(jù)治理的基礎(chǔ),通過元數(shù)據(jù)管理幫助完成動車組運維數(shù)據(jù)信息、服務(wù)信息與業(yè)務(wù)信息的采集,實現(xiàn)海量數(shù)據(jù)的高效管理與數(shù)據(jù)資源可視化,幫助管理人員隨時掌握數(shù)據(jù)資產(chǎn)狀況,同時支持接口服務(wù)的生成與ETL接入功能[7]。
(4)數(shù)據(jù)處理。數(shù)據(jù)處理模塊主要完成對結(jié)構(gòu)化與非結(jié)構(gòu)化數(shù)據(jù)的抽取、加載、檢測、轉(zhuǎn)換、匯總、整合等功能,通過一系列完整的數(shù)據(jù)處理流程實現(xiàn)數(shù)據(jù)標(biāo)準(zhǔn)化,為后續(xù)各類應(yīng)用服務(wù)、基礎(chǔ)數(shù)據(jù)管理及數(shù)據(jù)分析服務(wù)提供數(shù)據(jù)基礎(chǔ)。
(5)數(shù)據(jù)存儲。針對源數(shù)據(jù)不同類型,利用大數(shù)據(jù)分布式存儲技術(shù),融合現(xiàn)有數(shù)據(jù)存儲方式實現(xiàn)多源異構(gòu)數(shù)據(jù)的快速高效存儲。
(6)數(shù)據(jù)分析。充分利用成熟算法與數(shù)據(jù)處理技術(shù)實現(xiàn)動車組運維數(shù)據(jù)服務(wù)平臺中流式數(shù)據(jù)與離線數(shù)據(jù)的處理與分析,結(jié)合具體業(yè)務(wù)需求,如故障預(yù)測、故障診斷、故障模型等,完成數(shù)據(jù)分析與模型生成功能。
(7)功能應(yīng)用。功能應(yīng)用模塊包含定制查詢與查詢結(jié)果展現(xiàn)、需求報表的定制與展現(xiàn)等平臺公共基礎(chǔ)功能,通過統(tǒng)一接口申請功能管理平臺接口,對其他業(yè)務(wù)系統(tǒng)提供數(shù)據(jù)共享、展示服務(wù)、統(tǒng)計分析等功能。
源數(shù)據(jù)系統(tǒng)中包含流式加密數(shù)據(jù),動車組相關(guān)系統(tǒng)使用此類數(shù)據(jù)時往往需要單獨架設(shè)服務(wù)器用來接收、解碼,這就意味著其他系統(tǒng)應(yīng)用此類數(shù)據(jù)會導(dǎo)致運用系統(tǒng)運營成本的提高,針對這些流式數(shù)據(jù)動車組運維數(shù)據(jù)服務(wù)平臺提供了相應(yīng)的數(shù)據(jù)處理策略。
以動車組車載信息無線傳輸系統(tǒng)(WTDS)數(shù)據(jù)為例,WTDS數(shù)據(jù)為動車組車載傳感器回傳數(shù)據(jù),動車組運行過程中車載傳感器將數(shù)據(jù)實時回傳至WTDS系統(tǒng)服務(wù)器,WTDS系統(tǒng)服務(wù)器接收傳感器回傳數(shù)據(jù)后將數(shù)據(jù)通過ActiveMQ (消息中間件)同步至動車組運維數(shù)據(jù)服務(wù)平臺Kafka服務(wù)器。利用基于內(nèi)存的大數(shù)據(jù)并行計算分析組件spark對WTDS加密數(shù)據(jù)進行解析,解析后的數(shù)據(jù)通過實時采集工具streamsets存入分布式數(shù)據(jù)庫HBase。為實現(xiàn)數(shù)據(jù)快速查詢,根據(jù)一定規(guī)則將解析后的數(shù)據(jù)進行分割,分割的數(shù)據(jù)頭存入基于Key-value的非關(guān)系型數(shù)據(jù)庫Redis中,當(dāng)有查詢需求時首先查詢Redis,實現(xiàn)查詢快速響應(yīng)。其他系統(tǒng)需要WTDS數(shù)據(jù)時,用戶可通過提交數(shù)據(jù)接口申請實現(xiàn)數(shù)據(jù)共享。
在系統(tǒng)設(shè)計時,各數(shù)據(jù)源系統(tǒng)多數(shù)采取獨立設(shè)計,較少考慮共存系統(tǒng)的標(biāo)準(zhǔn)化。即使存在數(shù)據(jù)交互的系統(tǒng),也只是定義了數(shù)據(jù)接口,且接口內(nèi)定義的參數(shù)代碼有時與各系統(tǒng)中的參數(shù)代碼存在差異,如車組、車次、車型等參數(shù),在各系統(tǒng)中的定義表示不盡相同。如果不對這些代碼進行統(tǒng)一標(biāo)準(zhǔn)轉(zhuǎn)換,則在數(shù)據(jù)集中存儲時很難實現(xiàn)統(tǒng)一,這也給數(shù)據(jù)整合帶來了難度。
代碼標(biāo)準(zhǔn)化轉(zhuǎn)換是ETL過程的步驟之一。按照標(biāo)準(zhǔn)編碼規(guī)則,將各系統(tǒng)的編碼與標(biāo)準(zhǔn)編碼之間定制映射,并在源數(shù)據(jù)進入數(shù)據(jù)管理層時,進行轉(zhuǎn)換處理。具體的標(biāo)準(zhǔn)編碼可考慮國際或國家標(biāo)準(zhǔn),或采用鐵道部專用系統(tǒng)標(biāo)準(zhǔn)代碼。
對于具有各種標(biāo)準(zhǔn)編碼的數(shù)據(jù)項,應(yīng)該盡可能使用標(biāo)準(zhǔn)編碼作為系統(tǒng)的統(tǒng)一編碼標(biāo)準(zhǔn);對于沒有標(biāo)準(zhǔn)編碼的數(shù)據(jù),應(yīng)首選關(guān)鍵數(shù)據(jù)源系統(tǒng)(如核心業(yè)務(wù)模塊系統(tǒng))的編碼規(guī)則作為編碼標(biāo)準(zhǔn),以保證關(guān)鍵數(shù)據(jù)的一致性;對于關(guān)鍵數(shù)據(jù)源系統(tǒng)中沒有編碼的數(shù)據(jù)項,可采用其他多數(shù)數(shù)據(jù)源系統(tǒng)所采用的編碼規(guī)則作為編碼標(biāo)準(zhǔn),以保證多數(shù)數(shù)據(jù)的一致性,降低轉(zhuǎn)換負擔(dān)。
各源數(shù)據(jù)系統(tǒng)運行多年,基礎(chǔ)數(shù)據(jù)和各類業(yè)務(wù)數(shù)據(jù)大量積累,由于缺乏有效的管理與治理,造成數(shù)據(jù)雜亂、重復(fù)與模糊,對數(shù)據(jù)進行有效的預(yù)處理操作不僅可以保障數(shù)據(jù)的一致性與有效性,而且對后期數(shù)據(jù)分析與數(shù)據(jù)挖掘具有重要意義。
源數(shù)據(jù)系統(tǒng)將數(shù)據(jù)抽取至采集層后,針對所采集的不同類型數(shù)據(jù)采取對應(yīng)的數(shù)據(jù)預(yù)處理方法。例如:對于重復(fù)冗余數(shù)據(jù),若數(shù)據(jù)格式為字符串型則可通過對比去重,若數(shù)據(jù)格式為數(shù)值型則可通過基本緊鄰排序算法進行去重;對于缺失數(shù)據(jù),采取尋找臨近值方法進行插值填充,若數(shù)據(jù)實例較多則直接忽略缺失數(shù)據(jù);對于噪聲數(shù)據(jù),利用IPF與EF算法進行噪聲過濾處理,濾除干擾數(shù)據(jù)[8]。
(1)系統(tǒng)數(shù)據(jù)源優(yōu)化。動車組履歷系統(tǒng)主要針對新造和檢修動車組以及動車組所有關(guān)鍵配件進行管理的信息系統(tǒng),記錄了車組級履歷信息、配件級履歷信息和關(guān)鍵配件組成信息。其中車組級履歷信息包括:車組號、車組批次、車組名稱、車型、制造廠商、車長、車寬、車高等車組基本信息;配件級履歷信息包括:部件產(chǎn)品表示代碼、產(chǎn)品序列號、配件生產(chǎn)日期、配件狀態(tài)等配件信息;關(guān)鍵配件組成信息包括:關(guān)鍵配件結(jié)構(gòu)、子配件安裝位置、關(guān)鍵配件安裝車組、安裝時間等關(guān)鍵配件信息。
目前,動車組履歷系統(tǒng)數(shù)據(jù)分別來源于主機廠、檢修基地、各動車段及下屬動車運用所、設(shè)備供應(yīng)商和配件供應(yīng)商等。不同數(shù)據(jù)源通過接口將數(shù)據(jù)推送至動車組履歷系統(tǒng)。在系統(tǒng)使用過程中出現(xiàn)了由于通信接口不斷增多導(dǎo)致接口管理工作復(fù)雜化,同時存在部分人工檢修復(fù)核數(shù)據(jù)不準(zhǔn)確造成的數(shù)據(jù)質(zhì)量差以及數(shù)據(jù)更新不及時等諸多問題。
動車組運維數(shù)據(jù)服務(wù)平臺的構(gòu)建能夠有效解決以上問題。動車組運維數(shù)據(jù)服務(wù)平臺所管理的數(shù)據(jù)覆蓋了動車組全生命周期內(nèi)的所有相關(guān)數(shù)據(jù),因此,其可以作為動車組履歷系統(tǒng)的惟一數(shù)據(jù)來源。通過統(tǒng)一接口,動車組運維數(shù)據(jù)服務(wù)平臺為動車組履歷系統(tǒng)提供可靠有效的數(shù)據(jù),從而解決動車組履歷系統(tǒng)接口和數(shù)據(jù)質(zhì)量問題。
(2)故障預(yù)測與健康管理(PHM)建設(shè)。目前鐵路投入運營的動車組已經(jīng)超過3 000組,動車組在運用、高級修期間產(chǎn)生了大量的運維數(shù)據(jù),但缺乏對數(shù)據(jù)的綜合分析與利用,缺少對關(guān)鍵部件全壽命周期內(nèi)性能演變規(guī)律的研究。動車組PHM是指動車組的故障預(yù)測與健康管理,是綜合利用現(xiàn)代信息技術(shù),為實現(xiàn)鐵路設(shè)施全壽命周期的管理、動車組從“計劃修”向“狀態(tài)修”的轉(zhuǎn)變、同時提高動車組檢修質(zhì)量與效率、降低運維成本的有效方案。
動車組PHM在建設(shè)與投入運用過程中,需要大量動車組相關(guān)運維數(shù)據(jù)用于狀態(tài)分析與模型計算。動車組運維數(shù)據(jù)服務(wù)平臺集成了動車組“1車1檔”信息,包含從動車組新造到投入運營生產(chǎn)及檢修產(chǎn)生的所有靜態(tài)履歷和動態(tài)履歷信息,為動車組PHM建立覆蓋動車組全生命周期的數(shù)據(jù)資源目錄提供了完整的數(shù)據(jù)支撐。利用動車組運維數(shù)據(jù)服務(wù)平臺,有利于確立動車組PHM數(shù)據(jù)采集機制、數(shù)據(jù)分級管理、開放共享模式和數(shù)據(jù)標(biāo)準(zhǔn)規(guī)范。同時,使用平臺接口申請功能,獲取動車組開行、運行故障、WTDS、TEDS等數(shù)據(jù),可作為動車故障預(yù)測及健康管理模型的標(biāo)準(zhǔn)輸入。動車組運維數(shù)據(jù)服務(wù)平臺在動車組PHM建設(shè)過程中起到了不可或缺的數(shù)據(jù)支撐作用。
隨著大數(shù)據(jù)熱潮與鐵路信息化建設(shè)的全面開展,信息化管理在生產(chǎn)中成效顯著。動車組運維數(shù)據(jù)服務(wù)平臺面向動車段配屬、計劃、履歷、故障、大部件等系統(tǒng)業(yè)務(wù),迎合多種業(yè)務(wù)需求,與現(xiàn)有的動車組信息系統(tǒng)建立聯(lián)系。通過數(shù)據(jù)規(guī)范制定、大數(shù)據(jù)平臺搭建、數(shù)據(jù)倉庫建設(shè)、元數(shù)據(jù)管理等一系列流程建設(shè),該平臺具備數(shù)據(jù)規(guī)范治理、數(shù)據(jù)共享、數(shù)據(jù)挖掘、數(shù)據(jù)接口管理等功能,同時實現(xiàn)了動車組主數(shù)據(jù)統(tǒng)一管理、同步維護、集中發(fā)布和全路共享,對動車組PHM建設(shè),動車組智能運維,保障動車組安全運輸,提高經(jīng)營效益與運輸質(zhì)量,提升服務(wù)能力,具有重要的現(xiàn)實意義。