陶若冰,金珈輝,譚金練,張家豪,劉佳妮
(西南交通大學(xué) 電氣工程學(xué)院,四川 成都 610031)
客流需求進(jìn)行預(yù)測,以提高預(yù)測精度[7]。我國目前已經(jīng)成為世界上高速鐵路里程最長的國家,動車組在鐵路旅客運(yùn)輸中發(fā)揮著越來越重要的作用。但是,由于地域經(jīng)濟(jì)發(fā)展不平衡和人口密度差異性,高速鐵路在不同線路不同席別客流需求存在較大差異性。例如,蘭新高速鐵路(蘭州西—烏魯木齊)客流量少,上座率難以保證,單位運(yùn)量成本較大[1-2];而京滬高速鐵路(北京南—上海虹橋)、京津城際鐵路(北京南—天津)等發(fā)達(dá)區(qū)域的高速鐵路,客流需求快速增長,上座率高,存在運(yùn)能與運(yùn)量不適應(yīng)的矛盾,不同席別客流分配靈活性問題突出。對短期客流做出準(zhǔn)確預(yù)測,可以提高不同席別客流與動車組編組之間的匹配程度,盡可能做到按需按流配車,最大限度地滿足運(yùn)輸市場需求,降低高速列車線路使用費(fèi)用,減少單位運(yùn)營成本,實(shí)現(xiàn)經(jīng)濟(jì)和社會效益最大化[3]。
目前高速鐵路客流預(yù)測,針對不同席別的客流短期預(yù)測研究較少。高速鐵路客流預(yù)測模型主要有時(shí)間序列模型、神經(jīng)網(wǎng)絡(luò)模型、回歸分析模型等。李麗輝等[4]提出利用隨機(jī)森林回歸算法構(gòu)建客流預(yù)測模型。呂曉艷等[5]提出基于歷史與預(yù)售的時(shí)間序列預(yù)測方法對鐵路中客流總量進(jìn)行預(yù)測分析,但回歸分析法和時(shí)間序列模型都是基于數(shù)理統(tǒng)計(jì)學(xué)原理進(jìn)行預(yù)測的,預(yù)測精度有待提高。Fabio[6]以米蘭7號輕軌為研究對象,采用人工神經(jīng)網(wǎng)絡(luò)模型對其客流進(jìn)行預(yù)測,人工神經(jīng)網(wǎng)絡(luò)模型預(yù)測精度較高,但屬于黑箱模型,難以分析影響客流的主要因素,而且還沒有針對高速鐵路對不同席別的客流進(jìn)行分類分析及預(yù)測。為此,通過分析不同高速鐵路線路,將影響客流數(shù)據(jù)的因素按類型分為基礎(chǔ)因素和隨機(jī)因素,利用基礎(chǔ)因素和隨機(jī)因素的基本數(shù)據(jù),采用熵值法和變異系數(shù)法計(jì)算出影響系數(shù),再將BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果與影響系數(shù)結(jié)合,對不同席別客流數(shù)據(jù)進(jìn)行分類,對短期不同席別
由于動車組所在線路的不同,影響可變編組動車組客流的因素很多,可以分為基礎(chǔ)因素和隨機(jī)因素,可變編組動車組短期客流影響因素如圖1所示[4]。其中,基礎(chǔ)因素對短期預(yù)測影響波動相對較小,如經(jīng)濟(jì)因素、人口特征等,是客流預(yù)測必不可少的影響因素;隨機(jī)因素對短期預(yù)測影響波動相對較大,如天氣因素、行車安排、主觀因素等,這類影響因素對客流預(yù)測十分重要。
圖1 可變編組動車組短期客流影響因素Fig.1 Factors affecting short-term passenger flow in variable combination EMUs
1.1.1 熵值法
熵值法[8]是根據(jù)各項(xiàng)數(shù)據(jù)值的熵變程度來確定指標(biāo)權(quán)重的,這是一種客觀賦權(quán)法,避免了主觀因素帶來的偏差,因此采用熵值法作為影響系數(shù)階躍計(jì)算模型。在高速鐵路短期客流預(yù)測中,根據(jù)各項(xiàng)數(shù)據(jù)值所提供的信息大小來確定指標(biāo)熵權(quán),一級指標(biāo)下的二級指標(biāo)數(shù)為a,二級指標(biāo)的具體取值數(shù)為b。
(1)歸一化處理。為平衡各個輸入指標(biāo)數(shù)據(jù)的影響,需將原始數(shù)據(jù)進(jìn)行歸一化處理,去除量綱影響。
式中:Mkl為第l項(xiàng)二級指標(biāo)的第k項(xiàng)具體數(shù)據(jù);為Mkl歸一化處理后的無量綱數(shù)值;l取值范圍為(1,a);k取值范圍為(1,b)。
(2)確定影響系數(shù)模型。針對二級指標(biāo)下歸一處理后的數(shù)據(jù)向量= ()1×b,指標(biāo)值的差距越大,則該指標(biāo)在綜合評價(jià)中所起的作用越大。在計(jì)算不同指標(biāo)權(quán)重系數(shù)過程中,對二級到一級的指標(biāo)權(quán)重的選取采用熵值法,步驟如下。
計(jì)算第l項(xiàng)二級指標(biāo)第k個數(shù)值的階躍比重Pkl為
計(jì)算第l項(xiàng)二級指標(biāo)第k個數(shù)值的熵值ek為
計(jì)算第l項(xiàng)二級指標(biāo)第k個數(shù)值的熵權(quán)hk為
1.1.2 變異系數(shù)法
為了消除各項(xiàng)一級指標(biāo)的差異影響,需要用各項(xiàng)指標(biāo)的變異系數(shù)來衡量各項(xiàng)指標(biāo)取值的差異程度。故對于一級到目標(biāo)級指標(biāo),應(yīng)采用變異系數(shù)法,使影響系數(shù)結(jié)果更加科學(xué)合理。第l項(xiàng)二級指標(biāo)的變異系數(shù)Gl為
計(jì)算第x項(xiàng)一級指標(biāo)的具體量化數(shù)值Vx為
式中:σl為第l項(xiàng)二級指標(biāo)的標(biāo)準(zhǔn)差;為第l項(xiàng)二級指標(biāo)的平均數(shù)。
各項(xiàng)二級指標(biāo)的權(quán)重Sl為
由此可計(jì)算出高速鐵路客流影響系數(shù)具體量化數(shù)值F為
第x項(xiàng)一級指標(biāo)的權(quán)重Lx為
最終生成熵值法和變異系數(shù)法相結(jié)合的可變編組動車組客流的影響系數(shù)模型。
分析高速鐵路歷史客流數(shù)據(jù),發(fā)現(xiàn)在不同時(shí)期客流變化不同。除了客流變化的不同,不同席別客流變化具有明顯的非線性[9]。為了得到科學(xué)合理的預(yù)測結(jié)果,建立的不同席別客流預(yù)測模型需要有較強(qiáng)的針對性和較高的精確度[10]。因此,將不同席別的客流數(shù)據(jù)進(jìn)行分組,并依據(jù)不同時(shí)期的客流規(guī)律進(jìn)行再分組。選用BP神經(jīng)網(wǎng)絡(luò)模型作為不同席別短期客流主預(yù)測模型, BP網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 BP網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 BP network structure
由于需要預(yù)測的客流數(shù)據(jù)對于數(shù)據(jù)結(jié)果要求較為泛化,因而僅選取一層中間隱含層[11]。BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練過程基本步驟如下。
步驟1:信息的正向傳輸。正向傳播時(shí),傳播方向?yàn)檩斎雽印虚g層—輸出層,每層神經(jīng)元的狀態(tài)只影響下一層神經(jīng)元。
步驟2:修正的反向傳播。如果在輸出層得不到期望的輸出,則轉(zhuǎn)向誤差信號的反向傳播流程。
步驟3:循環(huán)記憶訓(xùn)練。通過步驟1和2的交替進(jìn)行,在權(quán)向量空間執(zhí)行誤差函數(shù)梯度下降策略,動態(tài)迭代搜索一組權(quán)向量,使網(wǎng)絡(luò)誤差函數(shù)達(dá)到合理范圍內(nèi),從而完成信息提取和記憶過程。
步驟4:學(xué)習(xí)結(jié)果判別。由中斷條件判斷訓(xùn)練是否結(jié)束,若沒有結(jié)束,則返回步驟 2。
通過熵值法、變異系數(shù)法得到影響系數(shù),再將影響系數(shù)與BP神經(jīng)網(wǎng)絡(luò)預(yù)測結(jié)果結(jié)合得到最終的預(yù)測結(jié)果??勺兙幗M動車組不同席別客流預(yù)測流程如圖3所示。
圖3 可變編組動車組不同席別客流預(yù)測流程Fig.3 Flow chart of different passenger flow prediction for variable combination EMUs
鐵路客流預(yù)測是基于某一時(shí)間段的運(yùn)輸客流量,根據(jù)預(yù)測周期長度可以將其分為中長期預(yù)測和短期預(yù)測。一般將1 ~ 3年的時(shí)間跨度稱為中長期預(yù)測,而1年以下的時(shí)間跨度稱為短期預(yù)測。傳統(tǒng)意義上的鐵路客流預(yù)測,一般選取沿線鐵路橫斷面客流量,在時(shí)間跨度上較大。針對目前鐵路運(yùn)輸客運(yùn)量短期預(yù)測方法的不足,采用BP神經(jīng)網(wǎng)絡(luò)與熵值法和變異系數(shù)法相結(jié)合的方法,對鐵路客流量進(jìn)行短期預(yù)測。
首先根據(jù)熵值法求出一級指標(biāo)具體量化數(shù)值,由于影響系數(shù)需要以天為單位進(jìn)行計(jì)算,因而時(shí)間點(diǎn)的選取以6 h為一個周期。根據(jù)公式(2)可以計(jì)算出二級指標(biāo)的階躍比重Pkl,隨后根據(jù)公式(3)計(jì)算出二級指標(biāo)的熵值ek,最后根據(jù)公式(4)計(jì)算出二級指標(biāo)的最終熵權(quán)hk,根據(jù)公式(5)得到熵值法對于一級指標(biāo)的具體量化數(shù)值Vx。由已知數(shù)據(jù)利用公式(6)可計(jì)算出二級指標(biāo)的變異系數(shù)Gl,隨之根據(jù)公式(7)計(jì)算出二級指標(biāo)的權(quán)重Sl,由此通過公式(8)計(jì)算出一級指標(biāo)的權(quán)重Lx。部分計(jì)算結(jié)果如表1所示。
表1 2017年11月3日部分計(jì)算結(jié)果Tab.1 Partial calculation results on November 3, 2017
最后根據(jù)公式(9)可以計(jì)算出2017年10—12月高速鐵路不同席別客流影響系數(shù)如圖4所示。
普通動車組一般由商務(wù)編組、餐車編組,以及一等座和二等座軟座編組組成,部分特殊編組添加臥鋪編組,極少部分具有高級臥鋪編組。一般以餐車為分界線,餐車的兩端分別是商務(wù)編組和軟座編組。選取京滬高速鐵路某16輛編組車次(商務(wù)編組和軟座編組) 2015—2017年3年共3 288組不同席別客流數(shù)據(jù)為實(shí)驗(yàn)對象,取2015年、2016年、2017年前9月共3 012組客流數(shù)據(jù)作為樣本數(shù)據(jù),取2017年后3個月不同席別客流數(shù)據(jù)為驗(yàn)證數(shù)據(jù)。
圖4 2017年10—12月高速鐵路不同席別客流影響系數(shù)Fig.4 In fluencing factors of short-term passenger flow at different seats from October to December 2017
首先對3 012組數(shù)據(jù)依據(jù)編組分為商務(wù)座、一等座和二等座各1 004組數(shù)據(jù),再依據(jù)特殊節(jié)假日、周末和工作日進(jìn)行日期分類建立樣本,接著利用MATLAB軟件對分類后的日期樣本數(shù)據(jù)帶入BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并降低其訓(xùn)練誤差 。由計(jì)算輸出和實(shí)際客流的誤差情況可知,BP神經(jīng)網(wǎng)絡(luò)在允許誤差范圍內(nèi),實(shí)現(xiàn)了對高速鐵路不同席別客流的準(zhǔn)確預(yù)測。2017年1—9月不同席別客流BP神經(jīng)網(wǎng)絡(luò)計(jì)算誤差如圖5所示。
圖5 2017年1—9月不同席別客流BP神經(jīng)網(wǎng)絡(luò)計(jì)算誤差Fig.5 Calculating errors of BP neural network for passenger flows at different seats from January to September 2017
利用2017年10—12月共276組數(shù)據(jù)帶入已完成訓(xùn)練的BP神經(jīng)網(wǎng)絡(luò)進(jìn)行測試,計(jì)算出不同席別原始客流數(shù)值??紤]到經(jīng)濟(jì)、高速鐵路行車安排等影響,再對不同席別原始客流數(shù)值進(jìn)行預(yù)測系數(shù)計(jì)算,得到2017年10—12月不同席別預(yù)測客流與實(shí)際客流結(jié)果如圖6所示。
圖6 2017年10—12月不同席別預(yù)測客流與實(shí)際客流結(jié)果Fig.6 Predicted passenger flow and actual passenger flow at different seats from October to December 2017
從圖6可知,訓(xùn)練后的BP神經(jīng)網(wǎng)絡(luò)與預(yù)測系數(shù)的組合預(yù)測能力較高,利用BP神經(jīng)網(wǎng)絡(luò)判斷不同席別客流變化的誤差較小,網(wǎng)絡(luò)泛化能力較好,因而該模型能在一定程度上實(shí)現(xiàn)對不同席別客流變化的判斷。
建立基于BP神經(jīng)網(wǎng)絡(luò)且結(jié)合熵值法和變異系數(shù)法模型,對可變編組動車組短期客流影響因素進(jìn)行分析,并建立了依據(jù)時(shí)期和席別的分組預(yù)測模型。從理論層面看,BP神經(jīng)網(wǎng)絡(luò)模型能夠較為精準(zhǔn)地預(yù)測不同席別客流,熵值法和變異系數(shù)法組合模型能夠綜合考慮影響高速鐵路短期客流各方面的因素。運(yùn)用的預(yù)測模型針對性較強(qiáng),能夠有效地預(yù)測可變編組動車組不同席別客流量,為可變編組動車組需求分析提供數(shù)據(jù)支撐,同時(shí)為確定編組數(shù)和不同席別配比提供科學(xué)依據(jù),實(shí)現(xiàn)按需按流配車。