趙隨海
(1.中國鐵道科學(xué)研究院集團有限公司 通信信號研究所,北京 100081;2.中國鐵道科學(xué)研究院集團有限公司 國家鐵路智能運輸系統(tǒng)工程技術(shù)研究中心,北京 100081)
《鐵路“十三五”發(fā)展規(guī)劃》明確提出加強鐵路行業(yè)數(shù)據(jù)中心建設(shè)、加大數(shù)據(jù)分析和研發(fā)力度、大力推進數(shù)據(jù)資源開發(fā)利用的鐵路信息化發(fā)展方向,有效提升了運輸指揮決策的科學(xué)性[1]。如何高效分析并利用我國鐵路列車調(diào)度指揮系統(tǒng)(TDCS)的列車運行實績數(shù)據(jù),挖掘數(shù)據(jù)中隱含的信息,為鐵路運輸管理層的科學(xué)決策和調(diào)度指揮的智能化提供決策支持,成為目前亟需解決的問題。
TDCS的列車運行實績數(shù)據(jù)具有海量化、多維化、地域化以及網(wǎng)絡(luò)化的特征,是典型的大數(shù)據(jù)[2]。目前,國內(nèi)對列車運行實績數(shù)據(jù)的應(yīng)用主要集中在列車及設(shè)備狀態(tài)的歷史復(fù)現(xiàn)、行車信息結(jié)果查詢、晚點分析等方面,而對列車運行實績數(shù)據(jù)的研究較少。劉巖等[3]通過研究京滬高速鐵路(北京南—上海虹橋)一個半月的列車運行實績數(shù)據(jù),從區(qū)間運行時分、列車停站時間與列車晚點之間的關(guān)系出發(fā),闡述了列車運行實績大數(shù)據(jù)分析對調(diào)度指揮工作的輔助作用;莊河等[4]基于武廣高速鐵路(武漢—廣州南)列車運行實績,研究了不同致因情況下初始晚點的時長分布模型,為高速鐵路調(diào)度指揮實踐提供理論指導(dǎo)。
TDCS在結(jié)構(gòu)上采用中國鐵路總公司、鐵路局集團公司、車站的3層結(jié)構(gòu),通過專用網(wǎng)絡(luò)通道和數(shù)傳設(shè)備實現(xiàn)了調(diào)度指揮信息的共享。從信息流方面可將TDCS劃分為指揮層和采集層2層結(jié)構(gòu)。指揮層通過運輸調(diào)度管理系統(tǒng)(TDMS)接口獲得日班計劃、列車編組和現(xiàn)車信息等,承擔(dān)了列車調(diào)度、計劃管理、綜合施工調(diào)度等功能;采集層實現(xiàn)信號設(shè)備狀態(tài)的采集,獲取實時的、完整的信號設(shè)備和列車運行的狀態(tài),是指揮層列車運行計劃兌現(xiàn)情況的真實反映。TDCS經(jīng)過近些年不斷的發(fā)展和完善,在立足于生產(chǎn)安全,注重于信息的實時性和準(zhǔn)確性的基礎(chǔ)上,逐步積累了大量的列車運行實績數(shù)據(jù)。
因此,為推進鐵路信息化的發(fā)展,強化數(shù)據(jù)資源的開發(fā)利用,迫切需要在滿足鐵路運輸管理需求的基礎(chǔ)上,構(gòu)建一套完整的,集合數(shù)據(jù)采集、分析、展現(xiàn)的體系結(jié)構(gòu),實現(xiàn)列車運行實績數(shù)據(jù)的匯總、分析和決策支持等方面的應(yīng)用。數(shù)據(jù)倉庫作為一個“面向主題的、集成的、穩(wěn)定的、反應(yīng)時間變化的、用于支持管理決策的數(shù)據(jù)集合”[5-10],恰能滿足列車運行實績數(shù)據(jù)多維度、深層次的分析需求[11]。通過網(wǎng)絡(luò)匯總方式將分散的數(shù)據(jù)進行加載、清洗,以標(biāo)準(zhǔn)、統(tǒng)一的數(shù)據(jù)格式加載到數(shù)據(jù)倉庫,向鐵路運輸管理層提供相應(yīng)的決策支持。
綜上所述,分析列車運行實績的組成和數(shù)據(jù)特點,研究TDCS數(shù)據(jù)倉庫的體系結(jié)構(gòu),規(guī)劃數(shù)據(jù)的組織方式,基于需求分析劃分維度,設(shè)計數(shù)據(jù)倉庫模型,從多維度對行車作業(yè)過程和設(shè)備狀態(tài)進行評估。借助聯(lián)機分析處理(OLAP)等數(shù)據(jù)分析工具,向鐵路運輸管理層提供具有針對性的決策支持,必然對鐵路運輸?shù)目茖W(xué)管理和決策支持提供重要的數(shù)據(jù)和理論基礎(chǔ)。
通過對鐵路列車調(diào)度指揮生產(chǎn)作業(yè)過程的研究以及行車作業(yè)管理崗位業(yè)務(wù)的需求分析,構(gòu)建TDCS數(shù)據(jù)倉庫體系結(jié)構(gòu)。鐵路列車調(diào)度指揮系統(tǒng)數(shù)據(jù)倉庫體系結(jié)構(gòu)如圖1所示。
從圖1可以看出,TDCS數(shù)據(jù)倉庫的體系結(jié)構(gòu)主要包括4個層次,分別是數(shù)據(jù)采集層、數(shù)據(jù)服務(wù)層,業(yè)務(wù)邏輯層和應(yīng)用層。
圖1 鐵路列車調(diào)度指揮系統(tǒng)數(shù)據(jù)倉庫體系結(jié)構(gòu)圖Fig.1 Architecture diagram of the data warehouse of TDCS
數(shù)據(jù)采集層主要實現(xiàn)靜態(tài)和動態(tài)數(shù)據(jù)的采集,預(yù)處理,提取、轉(zhuǎn)換、加載(Extraction,Transformation,Load,ETL )等業(yè)務(wù),實現(xiàn)列車運行實績數(shù)據(jù)的匯總,合成為宏觀管理數(shù)據(jù)的過程。TDCS數(shù)據(jù)倉庫采集的數(shù)據(jù)包括靜態(tài)基礎(chǔ)數(shù)據(jù)、動態(tài)生產(chǎn)運作數(shù)據(jù)和行車作業(yè)操作事件數(shù)據(jù)。基于TDCS數(shù)據(jù)的多源性,在數(shù)據(jù)采集過程中,通過構(gòu)建操作數(shù)據(jù)系統(tǒng)(ODS),實現(xiàn)對分布于不同區(qū)域數(shù)據(jù)的抽取和轉(zhuǎn)化,摘取有效數(shù)據(jù)并轉(zhuǎn)化為結(jié)構(gòu)標(biāo)準(zhǔn)、類型固定的數(shù)據(jù),再加載到數(shù)據(jù)倉庫中,以均衡數(shù)據(jù)倉庫加載、轉(zhuǎn)換、匯總數(shù)據(jù)的負(fù)擔(dān)。
(1)靜態(tài)基礎(chǔ)數(shù)據(jù)組織。TDCS數(shù)據(jù)倉庫首先要構(gòu)造完整的生產(chǎn)運作環(huán)境,包括靜態(tài)站場的描述信息(線路參數(shù)、公里標(biāo)、允許速度、橋梁、坡度、曲率半徑、隧道),列車基本編組信息(型號、換算長度、計算重量、速度參數(shù)、性能參數(shù)),列車運行圖(基本圖、日班計劃、作業(yè)信息)等。目前,TDCS已經(jīng)建立了豐富的基礎(chǔ)數(shù)據(jù),但這些基礎(chǔ)數(shù)據(jù)根據(jù)需求分布于不同的子系統(tǒng)中。因此,TDCS數(shù)據(jù)倉庫要將分散的靜態(tài)參數(shù)進行匯總、擴充和細(xì)化,建立完整的基礎(chǔ)信息數(shù)據(jù)字典。
(2)列車運行實績的采集。生產(chǎn)運作數(shù)據(jù)是TDCS數(shù)據(jù)倉庫的主要數(shù)據(jù)來源,是進行數(shù)據(jù)挖掘、分析和預(yù)測的核心數(shù)據(jù)。生產(chǎn)運作數(shù)據(jù)可分為基于時間序列的列車和信號狀態(tài)數(shù)據(jù)及行車作業(yè)過程數(shù)據(jù)。列車狀態(tài)數(shù)據(jù)描述在某一時刻列車的運行狀態(tài)(位置、速度、編組等),信號設(shè)備狀態(tài)數(shù)據(jù)描述某一時刻信號設(shè)備的狀態(tài)(空閑、鎖閉、占用等),行車作業(yè)過程數(shù)據(jù)描述行車作業(yè)人員接發(fā)列車作業(yè)的過程,如列車到發(fā)時間、接發(fā)列車順序、接車股道等的變更過程。
(3)行車作業(yè)操作數(shù)據(jù)。行車作業(yè)操作數(shù)據(jù)描述行車作業(yè)人員的操作事件、作業(yè)過程等,是對行車指揮人員動作的記錄,是體現(xiàn)調(diào)度指揮人員作業(yè)效率、行車組織能力的重要數(shù)據(jù)。
數(shù)據(jù)服務(wù)層層以提取匯總的采集層數(shù)據(jù)為基礎(chǔ),按照不同的維度組織數(shù)據(jù),構(gòu)建星型模型數(shù)據(jù)集,是數(shù)據(jù)倉庫體系結(jié)構(gòu)的核心。通過對列車
圖2 鐵路列車調(diào)度指揮系統(tǒng)數(shù)據(jù)倉庫實體關(guān)系模型Fig.2 Relationship model of entity of the data warehouse of TDCS
由圖2所表示的實體和關(guān)系模型可知,管理人員與調(diào)度指揮人員是一對多的關(guān)系,而調(diào)度指揮人員與設(shè)備是多對多的關(guān)系。TDCS數(shù)據(jù)倉庫應(yīng)以列車運行狀態(tài)、設(shè)備運行狀態(tài)和調(diào)度指揮人員的操作事件所反映的列車運行實績?yōu)橹黝},分析調(diào)度指揮人員和行車設(shè)備兩個實體。
(2)維度表的建立。維度是分析問題的角度,可概括為對主題所屬類型的描述。鐵路調(diào)度指揮管理層對行車作業(yè)人員調(diào)度指揮能力的考察通常是多方面的,如按時間段、站段、車站、列車、早晚點、線路、計劃兌現(xiàn)率、自動化率等考察。列車運行實績數(shù)據(jù)在本質(zhì)上是多維的,通過對不同維度的描述,從而構(gòu)成數(shù)據(jù)倉庫的維度表。
(3)事實表的建立。列車運行實績是對行車作業(yè)和列車運行事實的描述,是事實表數(shù)據(jù)的來源。事實表存儲的是業(yè)務(wù)數(shù)據(jù)聚合后的信息,既包括數(shù)據(jù)的詳細(xì)信息,也包括數(shù)據(jù)匯總分析后的度量結(jié)果,是基于某一維度度量的結(jié)果表。不同的維度需要建立不同的事實表。TDCS業(yè)務(wù)的度量分析包括作業(yè)類型、晚點數(shù)、設(shè)備利用率、進路辦理方式、股道運用等。
(4)星型模型的建立。星型模型一個主題的不同維度構(gòu)成事實表的不同列,以事實表為中心,不同維度為角,通過維度的鍵值與事實表相連接,調(diào)度指揮管理崗位的需求分析,簡化業(yè)務(wù)流程,分析系統(tǒng)的實體關(guān)系模型,確定TDCS數(shù)據(jù)倉庫的概念模型。分析列車運行實績數(shù)據(jù),確定管理崗位與數(shù)據(jù)之間的映射管理,進行數(shù)據(jù)倉庫的維度劃分,設(shè)計星型模型的TDCS數(shù)據(jù)倉庫模型。
(1)概念模型。我國鐵路列車調(diào)度指揮采用行車單一指揮的原則[12],在滿足基本的、方向性需求的基礎(chǔ)上,可將TDCS數(shù)據(jù)倉庫面向的實體概括為行車管理人員、調(diào)度指揮人員和行車設(shè)備(包括信號設(shè)備和列車等)。鐵路列車調(diào)度指揮系統(tǒng)數(shù)據(jù)倉庫實體關(guān)系模型如圖2所示。形成一種類似星形的視覺形狀。TDCS數(shù)據(jù)倉庫可按照時間、作業(yè)人員、車次、早晚點、車站和運行屬性等維度進行描述。鐵路列車調(diào)度指揮系統(tǒng)數(shù)據(jù)倉庫星型模型示意圖如圖3所示。
圖3 鐵路列車調(diào)度指揮系統(tǒng)數(shù)據(jù)倉庫星型模型示意圖Fig.3 Star model sketch diagram of the data warehouse of TDCS
TDCS數(shù)據(jù)倉庫基于多維模型設(shè)計的星型結(jié)構(gòu),可實現(xiàn)復(fù)雜的業(yè)務(wù)查詢、數(shù)據(jù)挖掘和分析等功能,能向調(diào)度指揮管理層提供更復(fù)雜的查詢方案,是業(yè)務(wù)邏輯層進行更深層次的數(shù)據(jù)分析、數(shù)據(jù)挖掘、大數(shù)據(jù)研究和智能調(diào)度等應(yīng)用的基礎(chǔ)。
TDCS數(shù)據(jù)倉庫在業(yè)務(wù)邏輯層應(yīng)循序漸進,逐步挖掘數(shù)據(jù)的可用信息,實現(xiàn)不同層次的數(shù)據(jù)分析,向調(diào)度指揮管理層提供針對性的決策支持。首先,充分研究列車運行過程和調(diào)度指揮管理層的需求,基于數(shù)據(jù)倉庫中已有的數(shù)據(jù),實現(xiàn)數(shù)據(jù)的匯總和不同類型的報表展現(xiàn);其次,建立列車運行實績的數(shù)據(jù)立方體(CUBE),通過數(shù)據(jù)立方體的旋轉(zhuǎn)、時間維的切片,以及基于維度的上卷、下鉆等操作,從不同的維度進行列車運行實績數(shù)據(jù)的分析和度量,展現(xiàn)給調(diào)度指揮管理層;最后,進行更深層次的數(shù)據(jù)挖掘,建立數(shù)理統(tǒng)計模型,探索列車運行過程和行車指揮的內(nèi)在規(guī)律,開發(fā)智能調(diào)度方面的應(yīng)用。
建立TDCS數(shù)據(jù)倉庫的目的是向鐵路運輸管理層提供列車運行實績數(shù)據(jù)的分析統(tǒng)計和決策支持,應(yīng)用層通過圖表和相關(guān)的應(yīng)用軟件提供數(shù)據(jù)展現(xiàn)。因此,在應(yīng)用層數(shù)據(jù)展現(xiàn)方面也應(yīng)遵循由簡到繁、逐步開發(fā)的過程。首先,可利用已有的商業(yè)工具,采用無需編程的報表制作,進行數(shù)據(jù)的統(tǒng)計分析和展現(xiàn)。其次,根據(jù)運輸管理的需求,開發(fā)基于Server/Client的專用軟件,以可視化程度高的圖形方式進行特定數(shù)據(jù)的展現(xiàn)。實現(xiàn)基于用戶特征和身份認(rèn)證的數(shù)據(jù)展現(xiàn)分類,針對用戶特征提供針對性的決策支持。最后,在確保數(shù)據(jù)安全的基礎(chǔ)上進一步開發(fā)基于Web服務(wù)和移動終端App應(yīng)用軟件,擴展數(shù)據(jù)共享范圍和數(shù)據(jù)的應(yīng)用場景。
TDCS數(shù)據(jù)倉庫體系結(jié)構(gòu)的研究,分析了列車運行實績數(shù)據(jù)的采集、轉(zhuǎn)換、存儲和應(yīng)用,從多維度對列車運行實績數(shù)據(jù)進行分析,構(gòu)建星型結(jié)構(gòu)的數(shù)據(jù)倉庫模型,并提出數(shù)據(jù)的展現(xiàn)和場景應(yīng)用,為鐵路運輸?shù)男畔⒒椭悄芑l(fā)展奠定了一定的基礎(chǔ)。鐵路調(diào)度指揮涉及的專業(yè)、部門眾多,各系統(tǒng)之間的信息交換仍然需要進一步完善。因此,TDCS數(shù)據(jù)倉庫的建設(shè)應(yīng)循序漸進,逐步分析并完善用戶需求,面向不同的主題分步建模與實現(xiàn),實現(xiàn)與其他專業(yè)調(diào)度的數(shù)據(jù)的統(tǒng)籌規(guī)劃,深入挖掘數(shù)據(jù)分析,探索有價值的信息,最終形成完整的數(shù)據(jù)倉庫。