黃海超,陳景雅,王 爽,王方偉
(河海大學(xué)土木與交通學(xué)院,江蘇 南京 210098)
軌道交通客流量預(yù)測(cè)是城市智能交通系統(tǒng)的重要組成部分,客流量不僅受歷史客流量、日期屬性等時(shí)間因素影響,也受空間因素如:溫度、風(fēng)速、氣壓等影響。 時(shí)間因素與空間因素對(duì)客流量的影響存在復(fù)雜非線性關(guān)系,是多種因素共同作用的結(jié)果[1]。
李潔等[2]在傳統(tǒng)預(yù)測(cè)模型的基礎(chǔ)上引入出行日期特征及節(jié)假日因素, 建立季節(jié)性差分自回歸滑動(dòng)平均模型(SARIMA),有效提高預(yù)測(cè)精度。 Sui等[3]建立了周末客流量與天氣因素之間關(guān)系的多元回歸模型,分析兩者的內(nèi)在聯(lián)系。 Xue 等[4]著重研究降雨因素對(duì)客流的影響。許熳靈等[5]進(jìn)一步引入不同的天氣因素, 并驗(yàn)證其對(duì)地鐵客流量時(shí)空分布的影響。Ni 等[6]考慮地鐵附近的媒體事件與客流變化規(guī)律,提高客流量的預(yù)測(cè)精度。 Tselentis 等[7]證明了單一模型具有局限性,加之如今龐大的數(shù)據(jù)規(guī)模,基于深度學(xué)習(xí)的混合預(yù)測(cè)模型[8]逐步替代了傳統(tǒng)機(jī)器學(xué)習(xí)。滕靖等[9]在考慮日期屬性和天氣因素的同時(shí),采用粒子群算法(PSO)優(yōu)化長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)并證明混合模型優(yōu)于傳統(tǒng)的LSTM。謝宇等[10]引入突發(fā)事件因素建立混合模型,提高模型對(duì)突發(fā)事件的預(yù)測(cè)精度。 此外,不引入外部因素,考慮鄰近站點(diǎn)的空間關(guān)聯(lián)的預(yù)測(cè)模型,如時(shí)空長(zhǎng)短期記憶 (ST-LSTM)[11], 多模式深度融合(MPDF)[12]等也一定程度上提高預(yù)測(cè)精度。 但是引入越多因素必然導(dǎo)致模型的復(fù)雜度提高, 需要在保證模型精度的同時(shí)提高模型效率。 李澤文等[13]提出主成分分析 (PCA) 對(duì)引入的多因素進(jìn)行降維,減少預(yù)測(cè)時(shí)間。 徐先峰等[14]通過(guò)K 近鄰算法提取特征,結(jié)合雙向長(zhǎng)短期記憶(BiLSTM)兼顧預(yù)測(cè)精度與速度。 李梅等[15]提出Pearson 相關(guān)分析法提取顯著影響因子,確定引入因素的維數(shù),具有良好的適用性。
由于空間、時(shí)間因素與客流量之間存在復(fù)雜的非線性關(guān)系,目前針對(duì)多因素與客流量關(guān)系的研究較少。 本文提出一種多因素建模方式,首先采用顯著性檢驗(yàn)確定采集的天氣因素是否與客流量序列相互獨(dú)立。 再通過(guò)GRA 提取天氣因素與客流量潛在的非線性關(guān)系并量化, 根據(jù)GRA 值逐步篩選關(guān)聯(lián)度低的天氣因素,降低模型復(fù)雜度。 最后采用深度學(xué)習(xí)的BiLSTM 進(jìn)行預(yù)測(cè),構(gòu)建GRA-BiLSTM 混合模型。 同時(shí)與傳統(tǒng)預(yù)測(cè)模型進(jìn)行對(duì)比,驗(yàn)證模型可靠性。
軌道交通客流量數(shù)據(jù)來(lái)自明尼蘇達(dá)州明尼阿波利斯至圣保羅2017-01-01~2018-09-30 每小時(shí)軌道交通客流量,明尼阿波利斯與圣保羅分別是明尼蘇達(dá)州第一、二大城市,旅客往來(lái)頻繁,客流規(guī)模大; 天氣數(shù)據(jù)來(lái)自美國(guó)國(guó)家海洋和大氣管理局,天氣數(shù)據(jù)共7 類,包括:大氣壓、溫度、露點(diǎn)、風(fēng)速、云量、可見(jiàn)度、天氣狀況。 對(duì)完全相同的、明顯異常及缺失的數(shù)據(jù)進(jìn)行清洗,獲得8 種數(shù)據(jù),每種數(shù)據(jù)15 246 條。 考慮到工作日與非工作日,人群出行規(guī)律,受天氣因素影響不同,從而使得客流量數(shù)據(jù)在工作日與非工作日呈現(xiàn)不同的特征,將數(shù)據(jù)劃分為工作日(約8.7 萬(wàn)條)與非工作日(約3.4 萬(wàn)條),分別訓(xùn)練。
采用Person 相關(guān)系數(shù)檢驗(yàn)天氣變量與客流量的相關(guān)程度, 利用t 雙邊檢驗(yàn)確定天氣因素是否與客流量服從不同分布。 結(jié)果如表1 所示,Person 系數(shù)均不超過(guò)0.4, 表明天氣因素與客流量并非簡(jiǎn)單的線性關(guān)系,所有天氣因素在0.05 水平上存在顯著差異,可作為獨(dú)立影響因素。
表1 天氣因素相關(guān)性分析Tab.1 Correlation analysis of weather factors
GRA 是灰色系統(tǒng)理論中的一種多因素統(tǒng)計(jì)分析方法,對(duì)一個(gè)系統(tǒng)發(fā)展變化態(tài)勢(shì)進(jìn)行定量描述和比較,適用于探究非線性相關(guān)性。 其基本思想是通過(guò)確定參考序列和若干個(gè)比較序列的幾何形狀相似程度來(lái)衡量因素間關(guān)系的強(qiáng)弱。 天氣因素對(duì)客流量的影響不是簡(jiǎn)單的線性關(guān)系,采用GRA對(duì)其潛在的非線性關(guān)系進(jìn)行進(jìn)一步分析,步驟如下:
1) 確定系統(tǒng)中的參考序列(客流量)和比較序列(天氣因素)。
2) 對(duì)客流量序列與天氣因素序列進(jìn)行無(wú)量綱化處理,消除不同量綱的影響,考慮到之后要將其作為神經(jīng)網(wǎng)絡(luò)的輸入變量,將其歸一到[-1,1]。
3) 計(jì)算客流量序列與天氣序列的關(guān)聯(lián)系數(shù)
式中:ξi(k)為客流量序列與第i 個(gè)天氣序列的關(guān)聯(lián)系數(shù),k 為序列元素的索引;x0(k)為歸一化的客流量序列;xi(k)為歸一化的天氣因素序列;ρ 為分辨系數(shù),ρ 越小,關(guān)聯(lián)系數(shù)間差異越大,區(qū)分能力越強(qiáng),通常取0.5。
4) 計(jì)算灰色關(guān)聯(lián)度
式中:m 為天氣因素的數(shù)目。
灰色關(guān)聯(lián)度如表2 所示,天氣因素與客流量相關(guān)性強(qiáng)弱為: 大氣壓>溫度>露點(diǎn)>風(fēng)速>云量>天氣狀況>可見(jiàn)度。
表2 天氣因素灰色關(guān)聯(lián)度Tab.2 Grey relational degree of weather factors
LSTM 是深度循環(huán)神經(jīng)網(wǎng)絡(luò)的代表, 通過(guò)門(mén)控單元實(shí)現(xiàn)時(shí)空記憶功能,同時(shí)有效緩解循環(huán)神經(jīng)網(wǎng)絡(luò)的梯度消失和爆炸問(wèn)題。 通過(guò)引入輸入門(mén)、遺忘門(mén)和輸出門(mén)等門(mén)控單元系統(tǒng),LSTM 可以控制何時(shí)忘記歷史信息或使用新信息更新單元狀態(tài),在解決非線性時(shí)間序列問(wèn)題時(shí)效果極佳,其過(guò)程可表達(dá)為
式中:it,ft,ot,ct分別為輸入門(mén)i,遺忘門(mén)f,輸出門(mén)o, 細(xì)胞狀態(tài)c 在t 時(shí)刻的輸出;Wxti,Wxtf,Wxto,Wxtc分別為輸入Xt與輸入門(mén)i,遺忘門(mén)f,輸出門(mén)o,細(xì)胞 狀 態(tài)c 的 權(quán) 重;Whti,Whtf,Whto,Whtc為 隱 藏 層 輸 出Ht與相應(yīng)門(mén)的權(quán)重;Wcti,Wctf,Wcto為細(xì)胞狀態(tài)輸出Ct與相應(yīng)門(mén)的權(quán)重;bi,bf,bo,bc為偏置向量;σ 為激活函數(shù)。
BiLSTM 基本原理與普通LTSM 相同, 結(jié)合正向、反向LSTM 同時(shí)對(duì)輸入時(shí)間序列Xt進(jìn)行前向和后向兩次訓(xùn)練,獲得預(yù)測(cè)交通流序列Yt。 BiLSTM 考慮數(shù)據(jù)間的關(guān)聯(lián)性, 進(jìn)一步提高LSTM 特征提取的全局性和完整性。 BiLSTM 結(jié)構(gòu)如圖1 所示。
圖1 BiLSTM 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.1 BiLSTM neural network structure
將天氣數(shù)據(jù)與客流量數(shù)據(jù)歸一化處理,并以前70 周數(shù)據(jù)作為訓(xùn)練集, 最后21 周作為測(cè)試集驗(yàn)證模型性能。 將前3 h 天氣因素、客流量(24 維)及當(dāng)前天氣因素(7 維)共31 維數(shù)據(jù)作為輸入,當(dāng)前客流量作為輸出。 迭代次數(shù)取200, 初始學(xué)習(xí)率設(shè)為0.005,同時(shí)為防止學(xué)習(xí)率過(guò)大,模型來(lái)回震蕩,采用衰減法動(dòng)態(tài)調(diào)整學(xué)習(xí)率, 每迭代50 次學(xué)習(xí)率衰減50% 。 損 失 函 數(shù) 采 用 均 方 根 誤 差, 通 過(guò)AdamOptimizer 優(yōu)化器對(duì)模型進(jìn)行優(yōu)化。 為優(yōu)化隱含層神經(jīng)元個(gè)數(shù),隨機(jī)抽取20%作為樣本進(jìn)行試驗(yàn),結(jié)果如圖2 所示。 當(dāng)隱含層神經(jīng)元超過(guò)64 個(gè)后訓(xùn)練時(shí)間大幅上升, 訓(xùn)練誤差減小效果不明顯,確定隱含層神經(jīng)元個(gè)數(shù)為64。
圖2 隱含層神經(jīng)元數(shù)目尋優(yōu)Fig.2 Optimization of neurons number in the hidden layer
根據(jù)以上參數(shù),建立BiLSTM 神經(jīng)網(wǎng)絡(luò),將包含所有天氣因素的神經(jīng)網(wǎng)絡(luò)命名為GRA-0, 根據(jù)GRA 值,逐步篩選關(guān)聯(lián)度低的天氣因素,如GRA-1為剔除“可見(jiàn)度”因素,輸入變量為27 維的模型,GRA-2 為剔除“可見(jiàn)度”、“天氣狀況”后輸入變量為23 維的模型,最終GRA-7 即為剔除7 種天氣因素,輸入變量?jī)H為歷史客流量的模型,也就是傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)模型。
平均絕對(duì)百分誤差(MAPE)體現(xiàn)了真實(shí)值與預(yù)測(cè)值的相對(duì)偏差, 可直接衡量預(yù)測(cè)結(jié)果的好壞,常被用于評(píng)價(jià)預(yù)測(cè)模型的優(yōu)劣。 均方根誤差(RMSE)可直接體現(xiàn)真實(shí)值與預(yù)測(cè)值的絕對(duì)差值,且特大或特小誤差對(duì)指標(biāo)影響明顯,可有效彌補(bǔ)MAPE 的不足。 采用這兩種指標(biāo)評(píng)價(jià)模型性能。 考慮到日期屬性對(duì)客流量的影響, 工作日與非工作日分別訓(xùn)練,每種模型訓(xùn)練3 次取平均值,結(jié)果如圖3 所示。
圖3 GRA-BiLSTM 工作日與非工作日預(yù)測(cè)結(jié)果Fig.3 GRA-BiLSTM prediction results on weekdays and weekend
從圖3 可以看出,無(wú)論是否處于工作日,不考慮天氣因素的神經(jīng)網(wǎng)絡(luò)(GRA-7),其預(yù)測(cè)誤差均小于考慮所有因素的神經(jīng)網(wǎng)絡(luò) (GRA-0)。這說(shuō)明將所有天氣因素作為輸入并不能提高預(yù)測(cè)精度, 反而因?yàn)殛P(guān)聯(lián)度低的天氣因素含有大量與客流量無(wú)關(guān)的信息, 相當(dāng)于訓(xùn)練過(guò)程擬合了樣本噪聲,預(yù)測(cè)精度反而降低。通過(guò)GRA 逐步篩選關(guān)聯(lián)度低的天氣因素,預(yù)測(cè)誤差有所降低,這是因?yàn)橥ㄟ^(guò)剔除低關(guān)聯(lián)度的因素相當(dāng)于樣本降噪。
天氣因素對(duì)工作日與非工作日客流量的影響存在明顯差異。 在工作日期間,僅考慮“大氣壓”的神經(jīng)網(wǎng)絡(luò)(GRA-6)誤差最小,這說(shuō)明工作日客流量受天氣因素影響較小,大部分天氣因素相當(dāng)于冗余的噪聲, 降低模型的學(xué)習(xí)效率; 在非工作日期間,同時(shí)考慮“大氣壓”、“溫度”、“露點(diǎn)”、“風(fēng)速”的神經(jīng)網(wǎng)絡(luò)(GRA-3)誤差最小,這說(shuō)明非工作日的客流量受天氣影響比較明顯,這些天氣因素都能給神經(jīng)網(wǎng)絡(luò)帶來(lái)正向影響。由表2 可知,最佳神經(jīng)網(wǎng)絡(luò)模型考慮的天氣因素,其GRA 值均大于0.6。 當(dāng)天氣因素與客流量的GRA 值高于0.6 時(shí),才可認(rèn)為該因素與客流量存在潛在關(guān)聯(lián),能提高神經(jīng)網(wǎng)絡(luò)的預(yù)測(cè)精度。
模型的收斂速度能反映所需的訓(xùn)練時(shí)間,收斂越快,訓(xùn)練時(shí)間相應(yīng)越短。 為驗(yàn)證根據(jù)GRA 篩選天氣因素對(duì)神經(jīng)網(wǎng)絡(luò)收斂速度的影響。 分別取工作日與非工作日中預(yù)測(cè)效果最佳的神經(jīng)網(wǎng)絡(luò)與GRA-0,GRA-7 訓(xùn)練過(guò)程的LOSS 曲線進(jìn)行對(duì)比。 結(jié)果如圖4 所示。
圖4 工作日與非工作日收斂速度對(duì)比Fig.4 Comparison of convergence rates on weekdays and weekend
可以看出,輸入維數(shù)最高的GRA-0,早期波動(dòng)較大,且收斂速度最慢,需要最長(zhǎng)的訓(xùn)練時(shí)間。 采用GRA 降維后,神經(jīng)網(wǎng)絡(luò)收斂速度顯著提高,訓(xùn)練效果更加穩(wěn)定, 且最終的訓(xùn)練效果優(yōu)于傳統(tǒng)模型GRA-7。
為驗(yàn)證模型可靠性,同時(shí)比較常用預(yù)測(cè)模型對(duì)多種天氣因素的應(yīng)答。分別采用LSTM 神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林(RF)、最小二乘支持向量機(jī)(LSSVM)作為基準(zhǔn)模型。 LSTM 采用與原模型相同的參數(shù)設(shè)置,RF預(yù)測(cè)模型根據(jù)經(jīng)驗(yàn)公式確定子樹(shù)數(shù)目,LSSVM 預(yù)測(cè)模型采用網(wǎng)格搜索確定最佳超參數(shù)c,g,預(yù)測(cè)結(jié)果如圖5 所示。 各模型經(jīng)GRA 處理后的預(yù)測(cè)誤差RMSE匯總于表3,最優(yōu)模型的預(yù)測(cè)結(jié)果加橫線表示。
圖5 工作日與非工作日預(yù)測(cè)模型對(duì)比Fig.5 Comparison of prediction model on weekdays and weekend
表3 不同預(yù)測(cè)模型對(duì)天氣因素的應(yīng)答Tab.3 Responses of different prediction models to weather factors
可以看出,無(wú)論是工作日還是非工作日,最優(yōu)GRA-BiLSTM 預(yù)測(cè)誤差顯著低于各最優(yōu)基準(zhǔn)模型。由于關(guān)聯(lián)度低的天氣因素包含大量噪聲,絕大部分GRA-0 模型的預(yù)測(cè)誤差高于GRA-7,且相差較大。BiLSTM 在工作日與非工作日的誤差波動(dòng)均低于其他模型,體現(xiàn)良好的抗噪聲干擾能力。
本文同時(shí)考慮時(shí)間因素(歷史客流、日期屬性)及空間因素(天氣),提出GRA-BiLSTM 預(yù)測(cè)模型,有效降低預(yù)測(cè)誤差,同時(shí)提高收斂速度及抗噪聲干擾能力。
1) 根據(jù)GRA 逐步剔除低關(guān)聯(lián)度變量, 發(fā)現(xiàn)工作日與非工作日客流量對(duì)天氣的應(yīng)答不同,但GRA 值0.6 可作為天氣因素對(duì)客流量是否具有正向影響的分界。
2) 關(guān)聯(lián)度低的天氣因素可能與客流量相關(guān)的信息較少,并非完全無(wú)關(guān)。 簡(jiǎn)單剔除仍會(huì)損失部分有效信息,天氣因素對(duì)客流量如何影響還需進(jìn)一步研究。