亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        基于隨機森林的列車到站時間預測方法

        2016-12-07 12:33:17袁志明馮姍姍
        鐵道運輸與經濟 2016年5期
        關鍵詞:晚點決策樹行車

        袁志明,張 琦,黃 康,馮姍姍

        YUAN Zhi-ming1, ZHANG Qi2, HUANG Kang2, FENG Shan-shan3

        (1.中國鐵道科學研究院 研究生部,北京 100081;2.中國鐵道科學研究院 通信信號研究所,北京100081;3.中國鐵道科學研究院 運輸及經濟研究所,北京 100081)

        (1.Postgraduate Department, China Academy of Railway Sciences, Beijing 100081, China; 2.Communication and Signaling Research Institute, China Academy of Railway Sciences, Beijing 100081, China; 3.Transportation and Economics Research Institute, China Academy of Railway Sciences, Beijing 100081, China)

        基于隨機森林的列車到站時間預測方法

        袁志明1,張 琦2,黃 康2,馮姍姍3

        YUAN Zhi-ming1, ZHANG Qi2, HUANG Kang2, FENG Shan-shan3

        (1.中國鐵道科學研究院 研究生部,北京 100081;2.中國鐵道科學研究院 通信信號研究所,北京100081;3.中國鐵道科學研究院 運輸及經濟研究所,北京 100081)

        (1.Postgraduate Department, China Academy of Railway Sciences, Beijing 100081, China; 2.Communication and Signaling Research Institute, China Academy of Railway Sciences, Beijing 100081, China; 3.Transportation and Economics Research Institute, China Academy of Railway Sciences, Beijing 100081, China)

        在鐵路行車調度指揮中,需要實時預測列車的到站時間,以便制定相應的運營策略,并提供較為可靠的旅客服務信息。在分析列車運行過程的基礎上,提出基于隨機森林的列車到站時間預測模型,并給出詳細的求解過程。最后利用津秦高速鐵路相關數(shù)據(jù)對模型進行仿真驗證,結果表明,基于隨機森林的列車到站時間預測方法能夠有效地提高列車到站時間預測的準確性。

        列車到站時間預測;隨機森林;決策樹;行車指揮

        1 概述

        準確地預測列車到站時間對于提升鐵路運輸行車指揮和運營控制水平具有十分重要的作用。調度指揮人員通常需要預測其管轄區(qū)域內的列車到站時間,以便制定和實施相應的調度指揮策略,進而有效降低晚點傳播的嚴重程度和影響范圍,以及提供較為可靠的旅客服務信息。列車到站時間的不確定性是實施有效運行調整的主要障礙之一[1],準確的列車到站時間預測是實現(xiàn)行車指揮自動化的關鍵技術之一。

        1.1 研究現(xiàn)狀

        國內外學者針對列車到站時間預測已經做過一些研究,在理論上提出了各種不同的預測方法和模型[2-8]。D’Ariano A 等[2]利用列車的實時位置和速度,結合列車的運動方程,動態(tài)計算列車的到站時間,這種方式假定列車的實際位置和速度可實時、準確和連續(xù)獲取,但在實際運營中往往不能滿足該條件;Goverde R M P[3]采用極大代數(shù)和 Petri 網(wǎng)的方法建立路網(wǎng)的解析模型,并對列車的到站和離站時間進行計算,在此基礎上對大規(guī)模路網(wǎng)的晚點傳播進行計算分析;Büker T[4]、Meester L E[5]等采用隨機理論分析列車到站時間的不確定性,建立到站時間的晚點概率分布模型進行列車到站晚點預測,這種方法假定列車到站晚點時間服從于某種概率分布,但在實際運營中,隨著外界環(huán)境的變化,概率分布會隨之發(fā)生相應變化。

        為彌補上述方法的不足,采用隨機理論對列車的到站時間預測進行研究,在分析列車到站時間不確定性的基礎上,提取相應特征指標,挖掘相應歷史行車數(shù)據(jù),以提高列車到站時間預測準確性為優(yōu)化目標,提出一種基于隨機森林的列車到站時間預測模型。

        1.2 列車運行過程分析

        在理想情況下,每列車按照計劃運行圖給定的時刻表運行以完成運輸生產任務,但在實際運輸生產過程中,不可避免地會發(fā)生一些難以預料的情況,如機車車輛故障、固定設備故障 (如信號設備)、鐵路沿線氣候變化、列車上線晚點等。這些難以預料的情況往往導致列車不能按照預定的時刻表運行,產生列車在車站的到達出發(fā)時刻與運行圖規(guī)定的到達時刻相背離等問題。

        列車運行圖較為具體地規(guī)定了運營列車的類型、在線路上的相應時空位置和作業(yè)任務,運行圖一旦確定,在較長時間內不會進行大的變動和調整,因而可以認為在運行圖穩(wěn)定不變的周期內,列車的作業(yè)任務是一個在固定線路上不斷重復實現(xiàn)運行圖的過程,列車運行可以視為一個重復采樣的過程,這為采用隨機理論預測列車到站時間提供了數(shù)據(jù)基礎。

        列車運行過程可以視為一個由到達和出發(fā)事件組成的離散事件序列 (列車通過事件可分解為到達和出發(fā)事件在極短的時間內相繼發(fā)生) ,事件間的連接可標識為通過相應的列車運行或停站過程實現(xiàn)事件狀態(tài)的轉移,并且事件按照固定的順序 j→k 依次激發(fā),其中 k = j + 1,j = 1,2,…,n-1,n 為整個列車運行生命周期的事件總和。根據(jù)轉移事件序列和轉移時間可以對列車的到站時間進行預測性推算。列車運行事件示意如圖1 所示。

        由圖1 可知,列車在車站內的作業(yè)分為到達和出發(fā)事件,在區(qū)間內的作業(yè)可視為一系列的到達事件,即列車開始占用信號意義上可分的線路區(qū)段,如利用信號機分割的閉塞分區(qū)。列車事件 i 和i + 1 間的轉移時間 Δti(如列車在閉塞分區(qū)內的走行時分) 可利用理論或經驗值,但理論和經驗值并不適合復雜變化的運營環(huán)境。通過數(shù)據(jù)挖掘的方法對歷史行車數(shù)據(jù)進行分析,可針對不同的行車環(huán)境計算出不同的運行時分。

        圖1 列車運行事件示意圖

        式中:ti表示事件 i 發(fā)生的時刻;Δtk為列車事件 k 與k + 1 間的轉移時間;表示 i 后的事件 j 的時刻。

        2 基于隨機森林的列車到站時間預測模型

        由上述分析可知,列車的到站時間預測可采用事件激發(fā)的方式,結合事件發(fā)生的時刻對未來事件的發(fā)生時刻進行預測。為提高預測的精度,利用歷史行車數(shù)據(jù)作為隨機森林的訓練樣本來生成隨機森林,建立基于隨機森林的列車到站時間預測模型。

        2.1 隨機森林原理

        隨機森林是一種利用多個弱分類器結合成一個強分類器的分類算法,包含多個未剪枝決策樹的集

        圖2 隨機森林原理圖

        隨機森林通過構造不同的訓練集來增加分類模型間的差異,從而提高組合分類模型的預測能力,通過 k 輪訓練得到 k 個分類器{h1(x),h2(x),…,hk(x)},再用其構造一個采用投票法的多分類模型系統(tǒng),其決策函數(shù)為

        式中:H (x) 為分類組合模型;hi(x) 為決策樹分類模型;Y 為目標變量;I (·) 為示性函數(shù)。

        2.2 列車到站時間預測的屬性特征

        列車的運行可歸納為一系列順序發(fā)生事件的集合,事件狀態(tài)轉移需要的時間依賴于運營環(huán)境和列車的自身狀態(tài)。為構造隨機森林,需要提取狀態(tài)轉移的特征。構建訓練集屬性特征如下。

        (1)運行時間。列車在區(qū)間的相鄰運行事件間的轉移時間,即事件 j→j +1 的狀態(tài)轉移時間。在固定閉塞制式下,該屬性表示列車從進入一個閉塞分區(qū)到進入下一個閉塞分區(qū)需要的時間。為便于判斷到站時間,可以將車站內的接車進路和發(fā)車進路各視為一個閉塞分區(qū)。

        (2)剩余時間。列車行駛至目標車站需要的時間,即事件 j→k 的狀態(tài)轉移時間,k 為目標車站到站事件。

        (3)已用時間。列車出站至當前事件發(fā)生時實際已用時間,即事件 j→k 的狀態(tài)轉移時間, j 為出發(fā)事件,k 為當前發(fā)生事件。

        (4)出發(fā)晚點情況下的剩余時間。在列車出發(fā)晚點的情況下,列車行駛至目標車站需要的時間。

        (5)行車約束集。包括列車的追蹤間隔、車站的容量限制、計劃的行車順序等。

        (6)信號約束集。包括線路的臨時限速、區(qū)間封鎖、天窗施工等。

        (7)列車種類。不同種類列車的事件轉移時間不同。

        采用對歷史行車數(shù)據(jù)進行統(tǒng)計挖掘的方式可以分析得出每個行車事件在各種特征組合下的列車到站時間概率。到站時間以計劃正點為基準,在此基礎上取 0~N min 作為預測的晚點時間,每 1 min 為單位劃分為 N + 1 個時間段,即…其中早上計劃到達時間歸類于正點范圍,晚點時間記為 0 min;大于 N min 歸類于晚點 N min 以上范圍。由此生成訓練集 D。

        2.3 基于隨機森林的列車到站時間預測模型

        隨機森林的生成過程分為以下步驟。

        步驟 1 (Bagging 過程):在訓練集 D 中有放回地隨機抽取 n 個樣本,作為一個決策樹的訓練樣本。

        步驟 2 (分裂屬性選擇過程):在 m 個屬性特征中隨機選取 m1個屬性作為子集指定給樹的每個節(jié)點,通常從中計算最優(yōu)的分割屬性。

        步驟 3 (決策樹生長過程):每棵樹重復分裂過程,并且完全生長,不進行剪枝。

        步驟 4 (生成隨機森林過程):重復步驟 1—步驟3,生長出多棵決策樹,生成隨機森林。

        步驟 5 (隨機森林投票過程):根據(jù)生成的多個樹分類器對數(shù)據(jù)進行判定,分類結果按每個樹分類器的投票多少而定。

        基于隨機森林的列車到站時間預測模型如圖3所示。

        圖3 基于隨機森林的列車到站時間預測模型

        模型采用事件激發(fā)的方式對列車的到站時間進行預測,將事件發(fā)生的時間、位置及相應的行車環(huán)境輸入訓練后的隨機森林模型,輸出相應的列車到站時間。

        3 仿真驗證

        為驗證隨機森林預測方法的有效性,利用津秦高速鐵路 (天津—龍家營) 調度集中系統(tǒng) (CTC) 的歷史信號數(shù)據(jù)和歷史運行圖數(shù)據(jù),構建仿真模擬環(huán)境。以 3 個月的數(shù)據(jù)作為隨機森林的數(shù)據(jù)訓練集,用隨后的歷史數(shù)據(jù)對模型進行驗證,將采用隨機森林模型預測的列車到站時間結果和實際列車到站時間進行比對,分析預測結果的正確度,以驗證設計的列車到站時間預測模型的實用和優(yōu)化效果。

        模擬環(huán)境采用津秦高速鐵路共 10 個車站的數(shù)據(jù),其中 4 個車站的股道數(shù)目超過 7 條,車站拓撲結構較為復雜。在天津—龍家營區(qū)段開行列車 17 對/d,其中高速列車 3 對/d,普速列車 14 對/d。上行列車運行周期內經歷 157 個事件,實際有效到達車站 9 個 (首站列車出發(fā)不計入到達車站);下行列車運行周期內經歷 161 個事件,實際有效到達車站 9 個 (首站列車出發(fā)不計入到達車站)。每個事件激發(fā)一次到站時間預測。

        構建隨機森林最多包含 300 棵決策樹,每次從7 個屬性中隨機選擇 4 個屬性來構建決策樹,并調整隨機森林中決策樹的數(shù)目,計算仿真結果的正確率和均方誤差 (MSE),仿真結果如圖4 所示。

        圖4 仿真結果

        由圖4 可以看出,隨著隨機森林中決策樹數(shù)目的增加,預測的正確率得到較明顯的提升;但當決策樹的數(shù)目超過 100 后,正確率的提升并不十分明顯。因此,森林中的決策樹數(shù)目并不是越多越好,需要根據(jù)實際情況進行設定。采用隨機森林的預測方法,列車到站時間預測的正確率在 78% 左右,比僅采用經驗值的預測方式有較好的提升。

        4 結束語

        有效預測列車的到站時間,是實現(xiàn)調度指揮自動化的基礎條件之一。通過研究列車到站時間預測問題,在采用列車事件建模的基礎上,結合隨機森林理論,構建基于隨機森林的列車到站時間預測模型,并采用津秦高速鐵路數(shù)據(jù)進行仿真,驗證了算法和模型的有效性。該方法已在成灌線 (成都—青城山),達成線 (達州—成都) 等鐵路調度集中系統(tǒng) (CTC) 中得到應用,有效提高了列車到站時間預測的準確性。

        [1] Corman F,Meng L. A Review of Online Dynamic Models and Algorithms for Railway Traffic Management[J]. IEEE Transactions on Intelligent Transportation Systems,2015,16(3):1274-1284.[2] D’Ariano A,Pranzo M,Hansen I A. Conflict Resolution and Train Speed Coordination Solving Real-time Timetable Perturbations[J]. IEEE Transactions on Intelligent Transportation Systems,2007,8(2):208-222.

        [3] Goverde R M P. A Delay Propagation Algorithm for Largescale Railway Traffic Networks[J]. Transportation Research Part C (Emerging Technologies),2010,18(3):269-287.

        [4] Büker T,Seybold B. Stochastic Modelling of Delay Propagation in Large Networks[J]. Journal of Rail Transport Planning & Management,2012,2(1): 34-50.

        [5] Meester L E,Muns S. Stochastic Delay Propagation in Railway Networks and Phase-type Distributions[J]. Transportation Research Part B (Methodological),2007,41(2):218-230.

        [6] 方匡南,吳見彬,朱建平,等. 隨機森林方法研究綜述[J].統(tǒng)計與信息論壇,2011,26(3):32-38. FANG Kuang-nan,WU Jian-bin,ZHU Jian-ping,et al. A Review of Technologies on Random Forests[J]. Statistics & Information Forum,2011,26(3):32-38.

        [7] 郭競文,孟令云,冉 鋒,等. 列車間不確定性資源請求沖突的預測方法[J]. 鐵道運輸與經濟,2014,36(7):34-39. GUO Jing-wen,MENG Ling-yun,RAN Feng,et al. Forecast Method of Uncertainty Resource Requiring Conflict between Trains[J]. Railway Transport and Economy,2014,36(7):34-39.

        [8] 韓雪松,滕愛兵. 貨運發(fā)到站與技術站間送達時間的優(yōu)化研究[J]. 鐵道貨運,2015,33(1):54-57. HAN Xue-song,TENG Ai-bing. Study on Optimization of Arrival Time between Freight Departure-receiving Stations and Technical Stations[J]. Railway Freight Transport,2015,33(1):54-57.

        責任編輯:呂 倩

        Forecast Method of Train Arrival Time based on Random Forest Algorithm

        During railway traffic dispatching control, train arrival time needs real-time forecast as to establish relative operation strategy and provide reliable passenger service information. Based on analyzing the train running process, this paper puts forward the forecast model of train arrival time based on random forest algorithm, and provides detailed solution process. In the end, the paper makes simulation verification on the model by using relative data of Tianjin-Qinhuangdao high-speed railway, the result shows the forecast method of train arrival time based on random forest algorithm could effectively increase the forecast accuracy of train arrival time.

        Forecast of Train Arrival Time; Random Forest Algorithm; Decision Tree; Traffic Dispatching Control

        1003-1421(2016)05-0060-04

        U292.4

        A

        10.16668/j.cnki.issn.1003-1421.2016.05.13

        2016-04-05

        中國鐵道科學研究院科研項目 (2015YJ054)

        猜你喜歡
        晚點決策樹行車
        基于馬爾科夫鏈的高鐵列車連帶晚點橫向傳播
        晚點的火車(外三首)
        金沙江文藝(2022年4期)2022-04-26 14:14:22
        一種針對不均衡數(shù)據(jù)集的SVM決策樹算法
        高速鐵路初始晚點致因-影響列車數(shù)分布模型
        決策樹和隨機森林方法在管理決策中的應用
        電子制作(2018年16期)2018-09-26 03:27:06
        夜間行車技巧
        汽車與安全(2016年5期)2016-12-01 05:22:12
        基于決策樹的出租車乘客出行目的識別
        吉普自由光行車制動易熄火
        調度調整在地鐵行車組織中的應用
        基于肺癌CT的決策樹模型在肺癌診斷中的應用
        久久久久成人精品免费播放| 日本高清视频www| 亚洲av日韩av无码av| 国产h视频在线观看网站免费| 亚洲av免费看一区二区三区| 99久久99久久精品国产片| 国产精品无码成人午夜电影| 亚洲欧洲日产国产AV无码| 精品少妇一区二区三区四区| 久久777国产线看观看精品| a级特黄的片子| 日韩欧美亚洲中字幕在线播放| 亚洲天堂一区二区三区视频| 国产成人精品免费久久久久| 少妇人妻偷人精品视频| 天堂最新在线官网av| 免费视频亚洲一区二区三区| 无码爆乳护士让我爽| 鲁一鲁一鲁一鲁一澡| 日本韩国黄色三级三级| 人妻熟女翘屁股中文字幕| 日日婷婷夜日日天干| 国产精品久久1024| 一区二区三区日韩毛片| 性无码一区二区三区在线观看| 丰满人妻妇伦又伦精品国产 | 亚洲av电影天堂男人的天堂| 窄裙美女教师在线观看视频| 国产女人av一级一区二区三区| 亚洲欧美国产精品久久| 亚洲人成网站在线观看播放| 精品国产一区二区三区久久狼| av熟妇一区二区三区| 久久水蜜桃亚洲av无码精品麻豆| 亚洲狼人社区av在线观看| 你懂的视频网站亚洲视频| 国产午夜成人av在线播放| 伊人网综合在线视频| 操老熟妇老女人一区二区| 久久久久久自慰出白浆| 欧美真人性做爰一二区|