王 曉,張星臣,陳軍華
WANG Xiao, ZHANG Xing-chen, CHEN Jun-hua
(北京交通大學 交通運輸學院,北京 100044)
(School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China)
基于TDCS數(shù)據(jù)分析的鐵路區(qū)間通過能力利用研究
王 曉,張星臣,陳軍華
WANG Xiao, ZHANG Xing-chen, CHEN Jun-hua
(北京交通大學 交通運輸學院,北京 100044)
(School of Traffic and Transportation, Beijing Jiaotong University, Beijing 100044, China)
在闡述區(qū)間通過能力利用分析傳統(tǒng)流程的基礎上,分析基于TDCS數(shù)據(jù)分析的區(qū)間通過能力分析原理及能力利用的基礎數(shù)據(jù)處理流程設計,提出基于數(shù)據(jù)庫拆分的海量數(shù)據(jù)獲取技術和基于XML的多源數(shù)據(jù)處理等TDCS數(shù)據(jù)處理關鍵技術,最后以包神鐵路為例,對線路困難區(qū)間的能力利用進行分析,并且給出合理化建議。實踐證明,基于TDCS數(shù)據(jù)分析的鐵路區(qū)間通過能力方法簡單易行,具有實際推廣意義。
鐵路運輸;能力利用;TDCS;數(shù)據(jù)挖掘
鐵路通過能力具有動態(tài)瞬時的特點,如何利用先進的技術方法,分析能力利用的波動規(guī)律和能力制約影響因素,實現(xiàn)對能力科學、有效、合理的利用,是目前鐵路區(qū)間通過能力亟待解決的問題。傳統(tǒng)的能力利用分析基于實測數(shù)據(jù),主要依靠調(diào)查人員實地調(diào)研獲取,所得數(shù)據(jù)隨機性大、樣本量少、代表性不強,以此為基礎進行能力利用分析不能客觀反映實際情況[1]。事實上,鐵路信息化的理想條件為能力利用研究提供數(shù)據(jù)基礎[2]。調(diào)度管理指揮系統(tǒng) ( TDCS ) 積累了大量的列車運行數(shù)據(jù)[3],這些數(shù)據(jù)規(guī)模龐大、真實可靠,蘊藏豐富的決策支持信息。利用 TDCS 數(shù)據(jù)進行能力利用分析具有精確、實時的特點,能夠動態(tài)反映特殊區(qū)段和特殊時期的能力利用情況。通過提出基于 TDCS 數(shù)據(jù)的能力利用分析方法,科學掌握線路能力利用情況,為進一步規(guī)劃決策、挖潛擴能提供依據(jù)。通過闡述能力利用分析原理,并且設計基于 TDCS數(shù)據(jù)的能力利用分析流程,重點解決海量數(shù)據(jù)拆分和多源數(shù)據(jù)處理的技術難點。
1.1 傳統(tǒng)的區(qū)間通過能力利用分析
能力利用研究是鐵路能力理論的核心問題[4],通過分析能力在不同時段和不同區(qū)域的使用情況,發(fā)現(xiàn)制約能力的薄弱環(huán)節(jié),找出關鍵因素,為能力的加強和發(fā)展指明方向。一般情況下,主要從車站、區(qū)間、線路 3 個方面進行能力利用分析,分析基礎是能力計算和測定,分析結果的客觀性和實時性取決于計算的精度和速度。
(1)區(qū)間能力計算 ( 原始資料獲取 )。查閱鐵路部門相關文件獲取區(qū)間運行時分、起停車附加時分、不同時到達間隔時間及會車間隔時間等列車運行參數(shù),按照區(qū)間實際情況選擇適宜的理想能力計算方法,如按追蹤運行圖、非追蹤的平行運行圖進行能力計算。
(2)實際能力測算 ( 人工寫實獲取 )。能力寫實是指統(tǒng)計不同類型的列車在某方向 ( 上行或下行 ) 一段時間內(nèi)通過車站的數(shù)量,寫實工作一般在車站進行,并且需要在一段時間 ( 3 d 以上 ) 內(nèi)持續(xù)進行。
(3)區(qū)間能力利用率等指標計算與圖表分析。根據(jù)所采集的數(shù)據(jù),可以求得平均利用率、分時段利用率等指標,最后結合實際情況提出挖潛擴能的合理化建議。
1.2 基于 TDCS 數(shù)據(jù)分析的區(qū)間通過能力分析
傳統(tǒng)對能力利用的分析限于數(shù)據(jù)樣本的有限性和隨機性,很難客觀反映能力實際使用情況與實時車流、人員操作、天氣情況等因素的關聯(lián)關系,給予管理者的決策支持顯得粗獷和模糊。通過 TDCS底層的海量數(shù)據(jù)支持,開發(fā)相應的信息系統(tǒng)能夠?qū)崿F(xiàn)對能力利用的實時分析。能力利用的波動規(guī)律和影響因素關聯(lián)關系的分析方法如下。
1.2.1 能力利用波動規(guī)律分析方法
定義能力利用率最高、次高的區(qū)間分別為第一飽和區(qū)間和第二飽和區(qū)間,能力利用長時間飽和的區(qū)間可以認為是限制區(qū)間,而傳統(tǒng)限制區(qū)間的確定方法是通過計算線路各區(qū)間運行圖周期時間所確定,運行圖周期時間最長的區(qū)間即為限制區(qū)間。
采用 HP 濾波法對不同季節(jié)和不同時間段的能力利用波動規(guī)律進行分析。HP 濾波法可以將趨勢循環(huán)變量 ( GCt) 分解為長期趨勢 ( Gt) 和周期波動個部分[5],方便了解能力利用波動規(guī)律的長期趨勢和周期波動。( Gt) 通常被定義為損失函數(shù)的最小化問題的解,計算公式為
式中:Yt為時間序列數(shù)據(jù),可分解為 Yt= Gt+ Ct,t = 1,2,…,n;λ 為平滑參數(shù) ( 正數(shù) ),Gt該值越大, 越平滑。
1.2.2 影響因素與能力利用的關聯(lián)分析方法
影響區(qū)間能力利用的因素很多,能力利用的波動主要由車流在時間與空間分布的不均衡性、車流組成結構的差異性,區(qū)間設備故障的隨機性等原因形成[6]。通過處理 TDCS 數(shù)據(jù),可以對這些影響因素與能力的關聯(lián)進行定量研究,考慮采用回歸分析方法進行分析。以確定列車比例與區(qū)間能力飽和程度的關系為例,確定各比例參數(shù)的計算公式為
式中:α 為某時間段內(nèi)區(qū)間平均能力利用率;β 為 2種不同類型列車比例,β = nA/ nB,其中 nA,nB分別為 A,B 類型列車數(shù)量,由列車運行實測數(shù)據(jù)統(tǒng)計出;λ1,λ2,b 為需要通過回歸確定的未知參數(shù)。
1.3 能力利用的基礎數(shù)據(jù)處理流程及關鍵步驟設計
基于 TDCS 數(shù)據(jù)分析的區(qū)間通過能力分析重點工作是對基礎數(shù)據(jù)的處理,TDCS 數(shù)據(jù)處理流程設計如圖1 所示。首先,獲取海量 TDCS 數(shù)據(jù)、處理多源數(shù)據(jù),從而得到可使用的原始數(shù)據(jù);其次,進行預處理、數(shù)據(jù)類型劃分等基礎工作;然后,進行列車區(qū)間運行時分、列車密度等參數(shù)分析,統(tǒng)計均值、中位數(shù)等描述性指標,用于波動規(guī)律分析和影響因素關聯(lián)分析;最后,重點描述能力利用波動規(guī)律數(shù)據(jù)處理流程和影響因素關聯(lián)分析流程。
圖1 TDCS 數(shù)據(jù)處理流程設計
1.3.1 能力利用波動規(guī)律數(shù)據(jù)處理
步驟 1:計算理論最大能力。由經(jīng)典計算公式[6]可知,首先需要獲取區(qū)間純運行時分。區(qū)間純運行時分的處理需要經(jīng)過以下步驟:①判定列車類型,由于同區(qū)間不同類型列車如萬噸列車(大列)、5 000 t 列車 ( 小列 ) 的運行時分不同,需要判定列車類型;②判斷列車經(jīng)由徑路,將原始數(shù)據(jù)表按車次號和時間排序,即可得到每列車的經(jīng)由徑路;③確定列車區(qū)間并為區(qū)間編號,列車經(jīng)由徑路上相鄰車站之間即為區(qū)間,編寫區(qū)間號;④劃分列車通過區(qū)間的類型,列車通過區(qū)間運行時分類型如表1所示,而純運行時分只為“通通”類型列車通過區(qū)間的時間;⑤獲取純運行時分,統(tǒng)計某種類型列車通過各區(qū)間的“通通”類型的運行時分,繪制頻率分布直方圖,進行形態(tài)分析,獲得不同可達度下的純運行時分[1]。
表1 第 i 區(qū)間 ( j-1 站至 j 站 ) 運行時分類型
步驟 2:統(tǒng)計區(qū)間實際能力。執(zhí)行步驟 1 中的①至③步,然后統(tǒng)計所有通過區(qū)間的列車總數(shù)。
步驟 3:計算能力利用率,繪制能力利用規(guī)律圖表。在繪制不同時段、不同區(qū)間的能力利用波動規(guī)律時,加入判定時間、判定區(qū)間的步驟。
1.3.2 影響因素關聯(lián)分析
步驟 1:計算能力利用率。
步驟 2:統(tǒng)計不同類型列車區(qū)間列車密度??梢园凑漳芰貌▌右?guī)律中步驟 2 進行處理,重點關注不同類型列車的劃分。
步驟 3:得到回歸分析能力利用率與不同類型列車比例變化之間的關聯(lián)關系。
2.1 基于數(shù)據(jù)庫拆分的海量數(shù)據(jù)獲取技術
列車運行過程中記錄了海量的運行數(shù)據(jù),如何從繁雜的數(shù)據(jù)中獲取能力利用相關信息是一項難題。采用數(shù)據(jù)庫拆分的數(shù)據(jù)獲取技術[7]獲取海量數(shù)據(jù),基本思路為:①將表格初步分類;②建立查詢,確定列車運行過程中事件觸發(fā)與表格記錄之間的關聯(lián),方便準確推斷表格內(nèi)容;③根據(jù)感興趣的數(shù)據(jù)垂直拆分表格,并且將拆分內(nèi)容存儲到不同數(shù)據(jù)表空間上,使數(shù)據(jù)在物理上被分離;④最后建立1 個鏈接所有分區(qū)的視圖,使數(shù)據(jù)在邏輯上仍然為一個整體。
2.2 基于 XML 的多源數(shù)據(jù)處理
TDCS 下中心邏輯處理子系統(tǒng)、調(diào)度終端子系統(tǒng)、車站子系統(tǒng)、網(wǎng)絡子系統(tǒng)等各子系統(tǒng),以及各子系統(tǒng)中包含的更多子系統(tǒng),它們之間數(shù)據(jù)記錄格式/類型不同,從而造就數(shù)據(jù)的多源性。對 TDCS 數(shù)據(jù)處理關鍵技術之一是對多源數(shù)據(jù)的處理。通過采用 XML ( eXtensible Markup Language 可擴展標記語言 ) 的異構數(shù)據(jù)轉(zhuǎn)換技術[8-9],提出基于 XML 的TDCS 多源數(shù)據(jù)處理方法如下。
步驟 1:從數(shù)據(jù)源提取數(shù)據(jù)。在數(shù)據(jù)提取文件中設置提取數(shù)據(jù)的規(guī)則,可以分別從多個數(shù)據(jù)源對應的多個數(shù)據(jù)庫中提取信息,如可以根據(jù)數(shù)據(jù)被記錄時的時間、列車類型或關鍵字等信息從數(shù)據(jù)庫中提取數(shù)據(jù)。
步驟 2:對提取的數(shù)據(jù)進行預處理。預處理數(shù)據(jù)包括異常數(shù)據(jù)剔除、缺失數(shù)據(jù)補齊、參數(shù)修正等。
步驟 3:生成第一 XML 文件。將所提取并且經(jīng)過預處理的數(shù)據(jù)直接映射為第一 XML 文件。
步驟 4:生成第二 XML 文件。將第一 XML 文件中的每個元素映射為 XML Schema 中的內(nèi)置數(shù)據(jù)類型的樣式,得到第二 XML 文件。XML Schema 的內(nèi)置數(shù)據(jù)類型可以分為基礎類型和派生類型,具有統(tǒng)一標準。
步驟 5:設置第二 XML 文件中的元素表現(xiàn)樣式。在設置元素間的關系時,應考慮最終的表現(xiàn)樣式盡可能清楚地反映鐵路運輸區(qū)間能力,同時考慮計算模型的需要,方便數(shù)據(jù)能夠被更清晰快速地訪問。
步驟 6:生成第三 XML 文件。第二 XML 文件中的元素根據(jù)表現(xiàn)樣式文件中所定義的元素間的關系進行數(shù)據(jù)轉(zhuǎn)換,生成用于交換的第三 XML 文件。典型的數(shù)據(jù)轉(zhuǎn)換形式包括重構、數(shù)據(jù)類型轉(zhuǎn)換、日期 / 時間格式轉(zhuǎn)換等。
步驟 7:能力利用數(shù)據(jù)處理。從第三 XML 文件中獲取數(shù)據(jù),以構建模型對區(qū)間能力利用進行分析。
以包神鐵路為例,選取其能力緊張的東線區(qū)段進行研究。通過對該線區(qū)間能力波動規(guī)律及大小列的比例變化對能力利用的影響進行研究,以驗證該能力利用分析方法的有效性和實用性。選取包神鐵路東勝—敖包溝、敖包溝—沙沙圪臺、沙沙圪臺—巴圖塔、巴圖塔—石圪臺、石圪臺—瓷窯灣的上下行區(qū)間,數(shù)據(jù)為 2012 年 1 月—2013 年 2 月的 TDCS數(shù)據(jù)樣本。
選取巴圖塔—沙沙圪臺區(qū)間的列車密度,統(tǒng)計不同時段的列車密度均值、最大值和最小值等指標,巴圖塔—沙沙圪臺不同時間段能力利用分析表2 所示,分析可知區(qū)間內(nèi)各時間段平均能力利用均衡,但最大值和最小值差異顯著 ( 時間段內(nèi)相差達到 10 列 ),表明波動較大。通過 HP 濾波分析法 ( 取經(jīng)驗值 14 400[10]) 得到的巴圖塔—沙沙圪臺區(qū)間日均能力利用率波動圖如圖2 所示,分析可知每日能力利用率差異明顯 ( 上行能力利用率在 0.4~0.65 之間,下行能力利用率在 0.5~0.75 之間 )。
表2 巴圖塔—沙沙圪臺不同時間段能力利用表
東線區(qū)段各區(qū)間利用率對比如表3 所示。通過分析可知,東線區(qū)段下行方向比上行方向能力利用率高 5 %~15 %;第一飽和區(qū)間為沙沙圪臺—巴圖塔區(qū)間,第二飽和區(qū)間為石圪臺—瓷窯灣區(qū)間,因而建議如下。①列車在這2個區(qū)間應加速運行,減少其對線路能力的限制。②石圪臺是支線與主線的交叉點,開行支線列車時應充分與主線協(xié)調(diào),盡量在主線空閑時開行,以減輕第二飽和區(qū)間的能力緊張程度。
圖2 巴圖塔—沙沙圪臺每日區(qū)間能力利用率波動圖
表3 各區(qū)間能力利用率對比
開行大列對緩解區(qū)間能力緊張作用明顯,在實際工作中確定大列開行的數(shù)量很難做到科學合理。以巴圖塔—石圪臺下行區(qū)間為例,通過數(shù)據(jù)挖掘分析大、小列比例與能力利用率間的定量關系,為確定大小列數(shù)量提供參考,計算公式為
經(jīng) F 檢驗,拒絕原假設的可能性為 3.12 × 10-6<0.05,表明擬合成功,該模型可行。通過對巴圖塔—石圪臺區(qū)間數(shù)據(jù)結果進行分析可知:①隨著區(qū)間開行大列的數(shù)量增加,區(qū)間能力利用率從 60 % 下降到 30 %,輸送能力卻從 25 萬 t 上升至 35 萬 t,巴圖塔—石圪臺下行回歸分析如圖3 所示;②根據(jù)圖3 可知,隨著大列數(shù)量增加,區(qū)間能力利用率降低的速度明顯減緩,比例超過 1.5 后變化不再明顯。
鐵路通過能力利用分析是現(xiàn)場管理人員決策的基礎,由于能力利用的影響因素很多,分析結果很難達到準確、全面和實時,不能達到?jīng)Q策支持的目標和要求。因此,提出基于 TDCS 數(shù)據(jù)分析的能力利用分析技術、方法和流程,通過設計基于 TDCS數(shù)據(jù)的能力利用波動規(guī)律和影響因素關聯(lián)分析的算法流程與步驟,解決數(shù)據(jù)獲取和處理難點。通過包神鐵路的實例分析,表明所提分析方法和數(shù)據(jù)處理技術簡單易行、可靠度高、實時性強,可以為管理人員實時掌握能力利用情況、進一步研究運行圖指標兌現(xiàn)率和運行圖結構等問題提供研究思路和借鑒。
圖3 巴圖塔—石圪臺下行回歸分析
[1] 王 軍,張星臣,張 懿,等. 基于監(jiān)控數(shù)據(jù)挖掘的運行圖參數(shù)查定與修正方法[J]. 中國鐵道科學,2011,32(4):117-121. WANG Jun,ZHANG Xing-chen,ZHANG Yi,et al. Method for the Measurement and Correction of Train Diagram Parameters based on Monitoring Data Mining[J]. China Railway Science,2011,32(4):117-121.
[2] 馬鈞培. 中國鐵路信息化建設與展望[J]. 交通運輸系統(tǒng)工程與信息,2005(5):5-9. MA Jun-pei. Construction and Prospect of Information Systems for Chinese Railways[J]. Journal of Transportation Systems Engineering and Information Technology,2005(5):5-9.
[3] 王興中. 鐵路調(diào)度指揮系統(tǒng)中數(shù)據(jù)存儲體系及索引結構的研究[D]. 北京:中國鐵道科學研究院,2011. WANG Xing-zhong. A Study of Data Storage System and Indexing Structure for the Railway Dispatching System [D]. Beijing:China Academy of Railway Sciences,2011.
[4] Abril M,Barber F,Ingolotti L,et al. An Assessment of Railway Capacity[J]. Transportation Research Part E Logistics & Transportation Review,2007,44(5):774-806.
[5] He Y,Wang B,Wang J,et al. Correlation between Chinese and International Energy Prices based on A HP Filter and Time Difference Analysis[J]. Energy Policy,2013,62(9):898-909.
[6] 楊 芳. 線路通過能力利用率的研究[D]. 蘭州:蘭州交通大學,2012. YANG Fang. Study on the Degree of Railway Line’s Capacity Utilization[D]. Lanzhou:Lanzhou JiaoTong University,2012.
[7] Villarroya S,Viqueira J. Geodadis:A Framework for the Development of Geographic Data Acquisition and Dissemination Servers[J]. Computers and Geosciences,2013,52(3):68-76.
[8] Agreste S,De P,F(xiàn)errara E,et al. XML Matchers:Approaches and Challenges[J]. Knowledge-Based Systems, 2014(66):190-209.
[9] 陳軍華,張星臣,徐 彬,等. 信息化條件下車站作業(yè)標準時間查定方法研究[J]. 交通運輸系統(tǒng)工程與信息,2011(3):119-123. CHEN Jun-hua,ZHANG Xing-chen,XU Bin,et al. Research on Railway Station Operation Standard Time Assessment Method under the Conditions of Informatization of Railway[J]. Journal of Transportation Systems Engineering and Information Technology,2011(3):119-123.
[10] 高鐵梅,王金明,梁云芳,等. 計量經(jīng)濟分析方法與建模[M]. 北京:清華大學出版社,2009. GAO Tie-mei,WANG Jin-ming,LIANG Yun-fang,et al. Econometrics Analyzes Methods and Modeling[M]. Beijing:Tsinghua University Press,2009.
責任編輯:吳文娟
Study on Utilization of Railway Section Passing Capacity based on TDCS Data Analysis
Based on expounding the traditional flow of utilization analysis of section passing capacity, this paper analyzes the analysis principle of section passing capacity based on TDCS data analysis and the design of basic data processing flow of the passing capacity utilization, and puts forward the key technologies of TDCS data processing such as the technology of mass data acquisition based on database sharding and the multi-source data processing based on XML. In the end, taking Baotou-Shenmu railway as an example, the paper analyzes the capacity utilization in dilemma line section, and gives reasonable proposals. The practice shows the method of utilizing railway section passing capacity based on TDCS data analysis is simple and practicable, and also has practical promotion significance.
Railway Transportation; Capacity Utilization; TDCS; Data Mining
1003-1421(2015)07-0021-05
U292.5+2
A
2015-05-20
國家自然科學基金資助項目 ( U1361114 )