帥春燕,謝亞威,單 君,歐陽鑫
(1. 昆明理工大學交通工程學院,昆明 650500;2. 昆明理工大學信息工程與自動化學院,昆明 650500)
近年來,我國城市軌道交通建設有了快速發(fā)展,但是軌道交通的運量經(jīng)常難以滿足客流量的需求,客流分布不均衡、換乘不便等問題亟待解決,軌道交通短時客流預測逐漸成為研究熱點,預測精度直接影響軌道交通運營計劃和組織方案的制定。熊杰等針對地鐵換乘客流量,提出了利用Kalman濾波進行短時客流預測的方法[1]。袁堅等從時空兩個維度分析軌道交通客流分布的特點,提出基于貝葉斯網(wǎng)絡的客流量預測方法[2]。平滑技術用于更清楚地揭示潛在趨勢、季節(jié)成分和周期成分[3]。時間序列本身不可避免地包含噪聲,對原始時間序列不加處理地直接進行建模和預測會對模型的預測能力產(chǎn)生影響[4]。楊靜等提出一種基于變點模型、小波模型、自回歸滑動平均模型(ARIMA)的組合模型來對軌道交通短時客流進行預測[5]。朱廣宇等基于軌道交通客流變化特點[6],構建自回歸求和滑動平均(ARIMA)模型和BP神經(jīng)網(wǎng)絡模型相組合的客流預測模型。趙陽陽等結合深度學習理論,提出一種基于經(jīng)驗模態(tài)分解與長短時記憶神經(jīng)網(wǎng)絡的短時地鐵客流預測模型[7],降低了地鐵客流樣本噪聲對客流預測模型的干擾。梁強升等考慮城市軌道交通客流的時空交互關系[8],提出一種融合循環(huán)門控單元和圖卷積神經(jīng)網(wǎng)絡的城市軌道交通客流預測模型(GCGRU)。趙建立等提出一種將卷積神經(jīng)網(wǎng)絡(CNN)與殘差網(wǎng)絡(ResNet)相結合的預測模型(ResNet-CNN1D)來解決城市軌道交通多站點短時客流量預測問題[9]。Haiying Li等提出一種預測出站客流和改善客流控制的動態(tài)徑向基函數(shù)神經(jīng)網(wǎng)絡[10]。郇寧等提出一種改進KNN算法的地鐵進站客流實時預測方法[11]。林濤等針對風速的強非線性特點,提出一種奇異譜分析和改進粒子群優(yōu)化自適應模糊推理系統(tǒng)的短期風速預測模型[12]。王茜竹等提出一種基于奇異譜分析(SSA)-自回歸移動平均(ARIMA)的短時客流預測方法[13],預測公交短時客流。
由于軌道交通進站客流具有規(guī)律性、隨機性以及噪聲等特性,客流特征在不同的時段也會有較大差異。單一模型目前已很難準確獲取客流的這些復雜特性,所以客流的短時預測也由單一模型向復合模型轉換。當時間間隔較短時,進站客流的規(guī)律性可能被隨機性掩蓋,而直接對原始數(shù)據(jù)進行預測可能會有較大誤差,為了能夠準確地獲取客流的短時變化特征,進而準確地預測客流,有必要對客流進行主要特征的提取和去噪。筆者結合AFC(自動售檢票系統(tǒng))數(shù)據(jù),提出了一種基于SSA分解,針對不同的客流成分采用SVR進行組合預測的SSA-SVR混合模型。實驗結果顯示,筆者的模型顯著提高軌道交通短時客流預測精度和預測穩(wěn)定性。
奇異譜分析(SSA)[14]是一種處理非線性時間序列數(shù)據(jù)的方法,通過對所要研究的時間序列的軌跡矩陣進行分解、重構等操作,提取出時間序列中的不同成分序列(長期趨勢、季節(jié)趨勢、噪聲等),從而對時間序列進行分析或去噪。采用SSA對時間序列進行分析并預測時,SSA相當于對原始序列作了低通濾波,濾去了序列中的高頻噪聲和非周期性的異?,F(xiàn)象,從包含噪聲的有限長觀測序列中提取出主要信息,并依據(jù)這些信息建立預測模型,增強了時間序列的可預測性。SSA既不需要假設參數(shù)模型,也不需要假設平穩(wěn)性條件,適用于分析含有潛在結構的非平穩(wěn)時間序列,目前已廣泛應用于水文預測、電力負荷預測和天氣預測等方面。筆者將之應用于分解提取出軌道交通客流的特征,算法執(zhí)行可分為以下4個步驟:
1) 嵌入。選擇適當?shù)那度刖S數(shù)d,將所觀察到的一維時間序列數(shù)XT=(x1, …,xT)轉化為d維序列Xi=(xi, … ,xi+d–1)T,則由K個向量組成的K列軌跡矩陣,如下式所示:
其中嵌入維數(shù)d的選擇規(guī)則為:
其中,N為樣本數(shù)量;?為每小時采樣數(shù);z為中間變量。
2) SVD分解。計算協(xié)方差XXT求得d個特征值λ1≥λ2≥, …, ≥λd≥0,U1, …,Ud為其所對應的正交特征向量,令則:
式中,X為第i個SVD分量;為矩陣X的奇異值;Ui為矩陣X的經(jīng)驗正交函數(shù);Vi為X的主成分;Ei為基本矩陣。
由上式得到矩陣XIk,生成序列X(k)=則原始序列可分解為m個時間序列的和:
支持向量機(SVM)使用結構風險最小化原則替代經(jīng)驗風險最小化原則,從理論上保證了模型的最大泛化能力[15]。支持向量機應用到非線性回歸估計和曲線擬合中,成為支持向量回歸機(SVR)。
通過極小化下式的結構風險系數(shù),使上式的估計真實風險最?。?/p>
式中,||w||2描述與模型復雜度相關的因素;C為懲罰系數(shù),C越大則對數(shù)據(jù)的擬合程度越高;為ε不敏感損失函數(shù),其定義如下:
上述函數(shù)回歸問題等價于:
并滿足以下條件:
其中ξi、為松弛變量,表示樣本偏離ε不敏感區(qū)域的程度。
對(14)式,求解模型的Lagrange對偶問題獲得原問題的最優(yōu)解:
其中,iα、*iα為Lagrange乘子為一個滿足Mercer條件的核函數(shù),徑向基核函數(shù)不僅具有較少的參數(shù),還具有良好的性能,因此,本文采用徑向基核函數(shù)構造SVM回歸機。徑向基核函數(shù)表達式如下:
本文中,徑向基核函數(shù)的參數(shù)γ和懲罰系數(shù)C是SVR模型需要確定的兩個參數(shù)。
所以,筆者提出SSA-SVR組合預測模型對地鐵進站客流進行預測,與現(xiàn)有的地鐵進站客流預測最優(yōu)模型進行對比,從而發(fā)現(xiàn)提高預測精度和穩(wěn)定性的一種新方法。
選取北京市軌道交通客流2015年11月共19個工作日的數(shù)據(jù),按每天06:00—23:00進行時間劃分,共計14條線路,268個站點。將站點劃分為:大量級為大于2.5×104(人)/d,共72個站點;中量級為1×104~2.5×104(人)/d,共116個站點;小量級為0~1×104(人)/d,共80個站點。在統(tǒng)計各站點日均進站客流量的量級基礎上,按從大到小將量級排序,如圖1所示。
圖1 268個站點日均進站客流量分布Figure 1 Daily average passenger flow distribution of 268 stations
按各站點日均客流量量級大小,以15 min為時間間隔,抽取部分站點,取前14天的數(shù)據(jù)為訓練集,后5天的數(shù)據(jù)為測試集,對站點進站客流預測未來5個工作日的每15min的客流。
在奇異譜分析中,窗口長度d取68,即一天交通客流量序列的長度。原始時間序列通過奇異譜分析,按從大到小進行奇異值的排序,劃分為趨勢、隨機、振蕩和噪聲4種成分(見圖2),筆者采用粒子群算法進行參數(shù)尋優(yōu),最后根據(jù)本數(shù)據(jù)尋得模型最優(yōu)參數(shù)為前30%特征值為主要重構序列成分,后3種為次要成分按順序分別取30%、30%和10%。
圖2 4種重構序列Figure 2 Four types of reconstruction sequences
現(xiàn)有地鐵短時客流預測模型中的數(shù)據(jù)輸入分為兩類:一是以天(d)為單位,不分時段,將所有歷史數(shù)據(jù)都作為輸入;二是將一天分為不同的時段,再把每天的同一時段的客流作為數(shù)據(jù)的輸入。由于地鐵客流的特點,以天為單位作為輸入,不能精確預測出地鐵一天中不同時段的客流量;以每天的某個時段作為數(shù)據(jù)輸入,前后時刻客流的影響難以把握,最終都會影響模型的精度。筆者采取將每天06:00—23:00時間內,按15 min為時間粒度,進行時段劃分。模型建立步驟如下:
步驟一:軌道交通客流時段劃分。以天為單位對客流進行時段劃分,輸入數(shù)據(jù)為劃分好的每個時段的客流。
步驟二:奇異譜分析。首先SSA模型對原始時間序列數(shù)據(jù)進行分析,得到去除噪聲的時間序列。具體從①嵌入:確定窗口長度;②分解:獲得多個奇異值;③分組:將奇異值按從大到小排序,利用粒子群尋優(yōu)得到的參數(shù)劃分奇異值的主要信息成分和次要成分;④重構:根據(jù)③的分組,選擇前n個主要成分組成新的時間序列,根據(jù)實際需求,重構時間序列分為4個部分進行分析。
步驟三:基于SVR模型預測。使用去除噪聲的時間序列,構建訓練樣本集,將重構后的時間序列作為支持向量回歸模型SVR的輸入,進行進站客流預測。
筆者采用以下預測評價指標:平均絕對值百分比誤差(MAPE)、均方根誤差(RMSE)、平均絕對誤差(MAE)、決定系數(shù)(R2)和準確率(Accuracy)對模型進行評價。
式中,yi為i時刻的實際客流值;為i時刻對應的客流預測值;N為預測的樣本數(shù)量;為i時刻客流真實值的平均值。
為了驗證SSA-SVR模型的高精度,筆者引入單一模型(ARIMA、SVR)以及組合模型(CNN-LSTM、T-GCN)作對比。ARIMA模型的使用前提是預測平穩(wěn)時間序列,對于非平穩(wěn)時間序列,需進行差分將其轉化為平穩(wěn)時間序列。SVR模型通過核函數(shù)將低維空間的數(shù)據(jù)映射到高維空間中,并對支持向量回歸進行擬合。CNN-LSTM模型[16]中的CNN與LSTM分別作為兩個通道輸入,CNN通過卷積獲取客流在空間上的特征和依賴,LSTM通過遞歸神經(jīng)網(wǎng)絡獲取客流數(shù)據(jù)在時間上的特征和依賴,從而使模型能同時獲得數(shù)據(jù)在空間維度和時間維度上的特征,并以時間序列預測的方式驗證融合模型特征提取的有效性。T-GCN模型[17]由圖卷積網(wǎng)絡(GCN)和門控循環(huán)單元神經(jīng)網(wǎng)絡(GRU)組成,GCN用來學習復雜的拓撲結構以捕獲客流的空間依賴關系,GRU學習客流數(shù)據(jù)的動態(tài)變化以捕獲客流的時間依賴,將圖卷積和門控循環(huán)單元融合起來以獲取客流的時空依賴關系,并進行客流預測。為了增強說服性,對進站客流進行預測時,ARIMA、SVR模型應尋找最優(yōu)參數(shù),獲得每個模型最優(yōu)的預測效果,模型參數(shù)設置如表1所示。
表1 對比模型參數(shù)設置Table 1 Comparison of the model parameter settings
分別從大、中、小三種量級站點中,選取6個典型站點作模型對比,大量級站點選取中關村、天通苑站點,中量級站點選取籬笆房、北新橋站點,小量級站點選取育知路、朝陽門站點,選取模型精度和均方根誤差兩個指標來評價模型,如圖3所示。
圖3 精度、均方根誤差比較Figure 3 Accuracy and root-mean-square error comparison
以籬笆房站點為例,SSA-SVR模型的精度分別比ARIMA模型、SVR模型、CNN-LSTM模型以及T-GCN模型分別提高了16.0%、16.0%、12.0%和22.0%。由圖3(b)可知,SSA-SVR模型的均方根誤差分別比ARIMA模型、SVR模型、CNN-LSTM模型以及T-GCN模型降低了49.2%、46.7%、56.4%和40.8%。
由圖4可知,中關村站和天通苑站兩個站點的進站客流只有單峰趨勢,且中關村站為晚高峰,天通苑站為早高峰,這與兩個站點周圍的用地性質相關。在大量級站點預測時,SSA-SVR模型的預測精度比ARIMA模型、SVR模型、CNN-LSTM模型以及T-GCN模型平均提高9.0%、10.5%、6.0%和17.0%?;h笆房站和北新橋站為中量級站點,在中量級站點預測時,SSA-SVR模型的預測精度比ARIMA模型、SVR模型、CNN-LSTM模型以及T-GCN模型平均提高12.5%、12.5%、10.5%和23.5%。育知路站和朝陽門站為小量級站點,在中量級站點預測時,SSA-SVR模型的預測精度比ARIMA模型、SVR模型、CNN-LSTM模型以及T-GCN模型平均提高9.5%、9.5%、6.0%和39.0%。
由以上指標可得,SSA-SVR模型對于短時客流預測精度的提高,在中量級站點明顯優(yōu)于其他模型。本文選取4種模型在不同量級典型站點的預測效果如圖4所示。
圖4 典型站點進站客流預測模型對比Figure 4 Comparison of inbound passenger flow forecasting models for typical stations
實驗模型的評價指標如表2所示,SSA-SVR模型的擬合度R2均在0.94以上,相同站點的擬合效果最佳。R2的值越接近1,說明真實值和預測值之間的擬合度越好,兩者之間有更相似的變化趨勢。
表2 模型指標實驗結果Table 2 Experimental results of model index
綜上所述,SSA-SVR模型在15 min軌道交通短時客流預測中表現(xiàn)出良好的預測性能和較好的穩(wěn)定性,具有良好的泛化性。
在對軌道交通短時客流預測時,SSA-SVR組合預測模型比單一模型和組合模型具有更高的精度和更穩(wěn)定的預測表現(xiàn)。在數(shù)據(jù)具有較復雜非線性特征的軌道交通短時客流預測時,筆者所提出的模型具有可靠的依賴性。
軌道交通客流的特點是隨機性和規(guī)律性,導致現(xiàn)有的大多數(shù)預測方法的精度不適用于預測地鐵客流。SSA-SVR模型,結合了奇異譜分析和支持向量回歸模型的優(yōu)點,將原始客流進行SSA模型分解,提取出原始序列分解后的特征,重構交通流量序列,將重構的交通流序列作為SVR模型的輸入條件,提高了模型的預測能力。
通過北京地鐵進站客流數(shù)據(jù)進行驗證,發(fā)現(xiàn)中量級站點預測精度沒有大量級站點和小量級站點精度高,所以,后續(xù)的工作可以針對中量級站點的預測精度進行研究,筆者所提出的模型也可為其他領域時間序列預測提供參考。