任 娜
(陜西交通職業(yè)技術(shù)學(xué)院,陜西西安 710018)
隨著經(jīng)濟(jì)不斷發(fā)展,城市交通得到迅速發(fā)展,許多城市出現(xiàn)了軌道交通網(wǎng)絡(luò)系統(tǒng),讓人們的工作、生活更加方便。軌道交通為解決大城市的交通擁擠提供了一種新的交通工具[1]。在軌道交通的實(shí)際應(yīng)用中,還存在一些問(wèn)題,如軌道交通與城市發(fā)展速度不相匹配,軌道交通規(guī)劃不夠科學(xué),無(wú)法使軌道交通網(wǎng)絡(luò)系統(tǒng)的作用發(fā)揮到最大化[2-4],而短時(shí)客流量可以描述城市軌道交通的運(yùn)營(yíng)情況,找到城市軌道交通客流量的變化趨勢(shì)。因此,進(jìn)行短時(shí)客流量預(yù)測(cè)和建模對(duì)軌道交通合理規(guī)劃和管理具有重要的研究意義[5-6]。
影響城市軌道交通短時(shí)客流量的因素復(fù)雜,并且其具有隨機(jī)性、周期性、相關(guān)性及非線性的特征,給城市軌道交通短時(shí)客流量預(yù)測(cè)建模帶來(lái)一定的困難。針對(duì)城市軌道交通短時(shí)客流量預(yù)測(cè)問(wèn)題,國(guó)內(nèi)外一些學(xué)者進(jìn)行了相關(guān)研究。最初城市軌道交通短時(shí)客流量預(yù)測(cè)基于傳統(tǒng)統(tǒng)計(jì)學(xué)理論,如,基于ARIMA的城市軌道交通短時(shí)客流量預(yù)測(cè)模型[7],其建模過(guò)程比較簡(jiǎn)單。ARIMA的城市軌道交通短時(shí)客流量預(yù)測(cè)模型,描述城市軌道交通短時(shí)客流量時(shí)變性能力不強(qiáng),因此預(yù)測(cè)結(jié)果不準(zhǔn)確[8]。隨后出現(xiàn)了基于現(xiàn)代統(tǒng)計(jì)理論的城市軌道交通短時(shí)客流量預(yù)測(cè)模型,如,支持向量回歸機(jī)、極限學(xué)習(xí)機(jī)、長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)等[9-11]。這些模型具有較好的自學(xué)習(xí)能力,城市軌道交通短時(shí)客流量預(yù)測(cè)效果明顯提升,而且已成為當(dāng)前城市軌道交通短時(shí)客流量預(yù)測(cè)建模的主要研究方向[12]。然而在實(shí)際應(yīng)用中,同樣存在一定的不足,如,支持向量回歸機(jī)的計(jì)算量大,預(yù)測(cè)城市軌道交通短時(shí)客流量效率低;極限學(xué)習(xí)機(jī)、長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)沒(méi)有考慮城市軌道交通短時(shí)客流量的混沌性,預(yù)測(cè)精度有待改善[13]。
為了獲得理想的預(yù)測(cè)結(jié)果,更加準(zhǔn)確地描述城市軌道交通短時(shí)客流量變化趨勢(shì),提出了深度學(xué)習(xí)算法的城市軌道交通短時(shí)客流量預(yù)測(cè)模型。該方法引入混沌理論構(gòu)建城市軌道交通短時(shí)客流量的訓(xùn)練樣本,并引入長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)城市軌道交通短時(shí)客流量預(yù)測(cè)模型,在相同仿真實(shí)驗(yàn)環(huán)境下,與其他模型進(jìn)行對(duì)比測(cè)試。結(jié)果表明,深度學(xué)習(xí)算法是一種預(yù)測(cè)精度高、結(jié)果可靠的城市軌道交通短時(shí)客流量預(yù)測(cè)模型,具有十分顯著的優(yōu)越性,為城市軌道交通短時(shí)客流量變化趨勢(shì)跟蹤提供了一種有效的建模方法。
對(duì)于城市軌道交通短時(shí)客流量數(shù)據(jù)的時(shí)間序列,當(dāng)時(shí)間序列為一維時(shí),城市軌道交通短時(shí)客流量變化特點(diǎn)不明顯,表面上沒(méi)有什么規(guī)律,為此需要對(duì)城市軌道交通短時(shí)客流量原始數(shù)據(jù)進(jìn)行重構(gòu),不斷拓展其維數(shù),找到城市軌道交通短時(shí)客流量隨時(shí)間變化的規(guī)律[14]。設(shè)城市軌道交通短時(shí)客流量原始數(shù)據(jù)序列為:X={x1,x2,...,xn},n表示數(shù)據(jù)長(zhǎng)度,設(shè)嵌入維數(shù)為m,時(shí)間延遲為τ,則經(jīng)過(guò)混沌分析和處理,得到
式(1)中,M表示相空間點(diǎn)數(shù),且有M=n-(-1)τ。
本文采用互信息法計(jì)算城市軌道交通短時(shí)客流量的時(shí)間延遲,用于描述城市軌道交通短時(shí)客流量的非線性變化特點(diǎn),平均信息熵計(jì)算公式為
式(2)中,pi和pj表示城市軌道交通短時(shí)客流量序列區(qū)間i,j內(nèi)的概率,pij(τ)表示聯(lián)合概率[15]。
當(dāng)平均信息熵達(dá)到第一個(gè)極小值時(shí),表示城市軌道交通短時(shí)客流量數(shù)據(jù)之間的關(guān)聯(lián)性最小,此時(shí)則得到了最優(yōu)的時(shí)間延遲。
采用Cao法確定城市軌道交通短時(shí)客流量的最優(yōu)嵌入維數(shù),步驟如下:
(1)在m+1維的空間中,第i,j個(gè)狀態(tài)點(diǎn)分別為,兩點(diǎn)之間的歐式距離比值計(jì)算公式為
(2)計(jì)算全部歐式距離比值的平均值,具體為
(3)計(jì)算E(m+1)和E(m)的比值Em,具體如下:
(4)不斷執(zhí)行步驟(1)~(3),當(dāng)Em變化比較平穩(wěn)時(shí),表示此時(shí)的嵌入維數(shù)為最優(yōu)。
深度學(xué)習(xí)算法是近幾十年才發(fā)展起來(lái)的人工智能技術(shù),其中長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)是一種最流行的深度學(xué)習(xí)算法,其利用“記憶單元”替換傳統(tǒng)神經(jīng)元,可以有效避免傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的“過(guò)擬合”現(xiàn)象出現(xiàn)。對(duì)比普通的循環(huán)神經(jīng)網(wǎng)絡(luò),其具有長(zhǎng)時(shí)記憶的功能,對(duì)比混沌分析和BP神經(jīng)網(wǎng)絡(luò),長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)具有更強(qiáng)的擬合能力。因此,本文利用長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)城市軌道交通短時(shí)客流量。長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)如圖1所示。
圖1 長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)Fig.1 Basic structure of long-term and short-term memory neural network
長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的建模包括兩個(gè)過(guò)程:前向傳播過(guò)程和反向傳播過(guò)程。其前向傳播過(guò)程具體如下:
設(shè)在t時(shí)刻,外部的輸入為xt,在時(shí)刻t-1的記憶單元、其他隱含層的狀態(tài)分別為st-1和bt-1,將它們作為輸入,那么在t時(shí)刻,輸入門(mén)的輸入和狀態(tài)分別為at l和具體如下:
式(7)中,f()表示激活函數(shù),I,H,C分別表示輸入層與記憶單元相連接的隱含層的神經(jīng)元數(shù)量,C表示所有輸入個(gè)數(shù),wil、whl和wcl分別表示和的權(quán)值。
在t時(shí)刻,遺忘門(mén)的輸入和狀態(tài)分別為,計(jì)算公式分別為
基于輸入門(mén)狀態(tài)的計(jì)算公式相似原理,可以得到在t時(shí)刻,輸出門(mén)的輸入和狀態(tài)的計(jì)算公式分別為
綜上可知,在t時(shí)刻,長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)整個(gè)輸出為
長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的反向傳播過(guò)程具體如下:
在t時(shí)刻,節(jié)點(diǎn)j、記憶單元Cell和Cell狀態(tài)的殘差為則輸出層和記憶單元Cell輸出向量的殘差計(jì)算公式分別為
輸出門(mén)、Cell單元、遺忘門(mén)、輸入門(mén)的殘差計(jì)算公式分別為
根據(jù)殘差的計(jì)算公式,可以得到長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)i與j之間的權(quán)值更新公式為
不斷更新得到新權(quán)值,直到長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)的輸出誤差達(dá)到預(yù)先設(shè)定的范圍,則長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)就終止學(xué)習(xí),得到最優(yōu)的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。
Step1:收集城市軌道交通短時(shí)客流量數(shù)據(jù),將它們按時(shí)間先后順序組成一個(gè)一維的時(shí)間序列數(shù)據(jù)。
Step2:采用互信息法計(jì)算城市軌道交通短時(shí)客流量的時(shí)間延遲,并采用Cao法確定城市軌道交通短時(shí)客流量的最優(yōu)嵌入維數(shù)。
Step3:采用時(shí)間延遲和最優(yōu)嵌入維數(shù)對(duì)城市軌道交通短時(shí)客流量時(shí)間序列進(jìn)行重構(gòu),建立城市軌道交通短時(shí)客流量預(yù)測(cè)的訓(xùn)練樣本集和測(cè)試樣本集。
Step4:長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)對(duì)城市軌道交通短時(shí)客流量預(yù)測(cè)的訓(xùn)練樣本集進(jìn)行學(xué)習(xí),計(jì)算網(wǎng)絡(luò)輸出和城市軌道交通短時(shí)客流量期望值之間的誤差,根據(jù)誤差不斷更新權(quán)值,當(dāng)達(dá)到給定的訓(xùn)練次數(shù)或者誤差時(shí),結(jié)束長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
Step5:根據(jù)訓(xùn)練好的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)建立城市軌道交通短時(shí)客流量預(yù)測(cè)模型。
Step6:采用測(cè)試樣本集對(duì)城市軌道交通短時(shí)客流量預(yù)測(cè)模型的性能進(jìn)行測(cè)試,并對(duì)測(cè)試結(jié)果進(jìn)行分析。
為了測(cè)試本文設(shè)計(jì)的深度學(xué)習(xí)算法的城市軌道交通短時(shí)客流量預(yù)測(cè)模型的性能,選擇一段時(shí)間的交通客流量作為測(cè)試對(duì)象,它們的變化曲線如圖2所示。
圖2 城市軌道交通短時(shí)客流量的歷史數(shù)據(jù)Fig.2 Historical data of short-term passenger flow of Urban Rail Transit
對(duì)圖2的城市軌道交通短時(shí)客流量數(shù)據(jù)進(jìn)行分析可知,其具有較強(qiáng)的隨機(jī)性變化特點(diǎn),采用互信息法和Cao法確定城市軌道交通短時(shí)客流量的時(shí)間延遲和最優(yōu)嵌入維數(shù),具體如圖3和圖4所示。進(jìn)一步分析發(fā)現(xiàn),城市軌道交通短時(shí)客流量數(shù)據(jù)的時(shí)間延遲和最優(yōu)嵌入維數(shù)最優(yōu)值分別為6和7,采用此值對(duì)圖2的城市軌道交通短時(shí)客流量數(shù)據(jù)進(jìn)行重構(gòu),選擇最后50個(gè)數(shù)據(jù)作為測(cè)試樣本,其他為訓(xùn)練樣本。
圖3 城市軌道交通短時(shí)客流量數(shù)據(jù)的時(shí)間延遲Fig.3 Time delay of short-term passenger flow data of Urban Rail Transit
圖4 城市軌道交通短時(shí)客流量數(shù)據(jù)的嵌入維數(shù)Fig.4 Embedding dimension of short-term passenger flow data of Urban Rail Transit
采用本文模型對(duì)50個(gè)城市軌道交通短時(shí)客流量測(cè)試樣本進(jìn)行預(yù)測(cè),結(jié)果如圖5所示。對(duì)圖5的城市軌道交通短時(shí)客流量實(shí)際值和預(yù)測(cè)值進(jìn)行分析,可以發(fā)現(xiàn)本文模型可以高精度跟蹤城市軌道交通短時(shí)客流量變化趨勢(shì),城市軌道交通短時(shí)客流量預(yù)測(cè)誤差極小,可以滿足實(shí)際的城市軌道交通管理要求。
圖5 本文模型的城市軌道交通短時(shí)客流量預(yù)測(cè)結(jié)果Fig.5 Prediction results of short-term passenger flow of urban rail transit based on the model in this paper
為了測(cè)試本文模型對(duì)于城市軌道交通短時(shí)客流量預(yù)測(cè)效果結(jié)果的優(yōu)越性,選擇沒(méi)有進(jìn)行混沌分析的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)、混沌分析+BP神經(jīng)網(wǎng)絡(luò)(Cao-BPNN)的城市軌道交通短時(shí)客流量預(yù)測(cè)模型進(jìn)行對(duì)比測(cè)試,采用平均絕對(duì)誤差(MAE)和平均絕對(duì)百分比誤差(MPAE)作為預(yù)測(cè)結(jié)果準(zhǔn)確性評(píng)價(jià)標(biāo)準(zhǔn),計(jì)算公式分別為
式(23)中,yi和y^i分別為城市軌道交通短時(shí)客流量第i個(gè)真實(shí)值和預(yù)測(cè)值;n表示樣本總量。
不同模型的城市軌道交通短時(shí)客流量結(jié)果指標(biāo)如表1所示。對(duì)表1進(jìn)行分析可知,相對(duì)于LSTM,本文模型的平均絕對(duì)誤差減少了4.32%,相對(duì)于Cao-BPNN,本文模型的平均絕對(duì)誤差減少了4.34%,這表明本文模型能夠獲得理想的城市軌道交通短時(shí)客流量預(yù)測(cè)結(jié)果,可以有效提高城市軌道交通短時(shí)客流量預(yù)測(cè)精度,驗(yàn)證了本文模型在城市軌道交通短時(shí)客流量預(yù)測(cè)中的優(yōu)越性。
表1 城市軌道交通短時(shí)客流量預(yù)測(cè)結(jié)果的多指標(biāo)對(duì)比Tab.1 Multi index comparison of short-term passenger flow prediction results of Urban Rail Transit
城市軌道交通短時(shí)客流量變化具有一定的規(guī)律性,同時(shí)具有一定的隨機(jī)性,為了降低城市軌道交通短時(shí)客流量預(yù)測(cè)偏差,結(jié)合城市軌道交通短時(shí)客流量變化特點(diǎn),采用深度學(xué)習(xí)算法對(duì)其進(jìn)行建模與預(yù)測(cè),與經(jīng)典模型測(cè)試結(jié)果對(duì)比,深度學(xué)習(xí)算法能夠高精度擬合城市軌道交通短時(shí)客流量變化趨勢(shì),城市軌道交通短時(shí)客流量預(yù)測(cè)整體效果明顯優(yōu)于經(jīng)典模型,解決了當(dāng)前城市軌道交通短時(shí)客流量預(yù)測(cè)過(guò)程中存在的一些問(wèn)題,可以對(duì)城市軌道交通運(yùn)力的合理配置提供一定的參考借鑒,具有較高的實(shí)際應(yīng)用價(jià)值。