亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        地鐵進站客流量 SARIMA 與 GA-BP神經(jīng)網(wǎng)絡組合預測模型

        2021-12-22 06:44:56強添綱裴玉龍
        鐵道運輸與經(jīng)濟 2021年12期
        關鍵詞:模型

        強添綱,劉 濤,裴玉龍

        (東北林業(yè)大學 交通學院,黑龍江 哈爾濱 150040)

        0 引言

        隨著城市經(jīng)濟的不斷發(fā)展,越來越多的城市選擇建設地鐵來緩解當?shù)氐慕煌〒矶隆3鞘械罔F網(wǎng)絡規(guī)模不斷擴大、客流量不斷增加等因素對地鐵的運營管理提出更高的要求,如何利用地鐵客流數(shù)據(jù)準確預測未來一段時期的客流量,對于制定合理的運營管理策略尤為重要。

        目前,客流量預測方法主要分為基于時間序列的統(tǒng)計預測模型、基于非參數(shù)的預測模型和組合預測模型。基于時間序列的預測模型方面,趙鵬等[1]利用季節(jié)求和自回歸移動平均模型(SARIMA)對北京地鐵的端點站、中間站、換乘站及接駁站進行客流預測,結果表明SARIMA模型有較高的預測精度。李潔等[2]利用SARIMA模型預測廣州南站、小欖站的發(fā)送客流量,與隨機森林(RF)、支持向量機(SVM)等預測方法對比發(fā)現(xiàn)在預測步長較大時SARIMA模型最優(yōu)。馬超群等[3]利用求和自回歸移動平均模型(ARIMA)進行擬合,并與自回歸模型(AR)、支持向量線性回歸模型(SVR)、反向傳播(BP)神經(jīng)網(wǎng)絡進行對比,發(fā)現(xiàn)在不同時間粒度下ARIMA模型平均預測精度最高。王瑩等[4]利用SARIMA模型對北京地鐵進站客流量進行預測,結果顯示模型預測的平均誤差為0.3%。

        基于非參數(shù)預測模型方面,Du等[5]提出一種比傳統(tǒng)客流預測模型效果更好的深度不規(guī)則卷積殘差(DST-ICRL)長短記憶(LSTM)網(wǎng)絡模型。Liu等[6]提出了一種端到端的深度學習架構(DeepPF)來預測地鐵客流量,研究結果表明DeepPF擁有較高的預測精度。Li等[7]提出一種多尺度徑向基函數(shù)(MSRBF)網(wǎng)絡預測地鐵客流量,實驗表明該模型預測精度高于其他智能模型。李潔等[8]根據(jù)時間序列數(shù)據(jù)建立循環(huán)神經(jīng)網(wǎng)絡(RNN)預測模型,結果表明RNN模型的預測精度與訓練數(shù)據(jù)的類型和數(shù)量存在較大關系。谷金晶等[9]利用公交IC卡上車數(shù)據(jù)構建BP神經(jīng)網(wǎng)絡和徑向基函數(shù)(RBF)神經(jīng)網(wǎng)絡,試驗結果表明RBF神經(jīng)網(wǎng)絡預測效果更好。

        組合預測模型方面,Wei等[10]提出了一種將經(jīng)驗模式分解(EMD)和BP神經(jīng)網(wǎng)絡相結合的混合EMD-BPN方法用于地鐵客流量預測。Dimitriou等[11]提出一種基于自適應混合模糊規(guī)則系統(tǒng)(FRBS)的城市干道交通流短期預測方法,試驗結果表明該方法優(yōu)于傳統(tǒng)的遺傳算法。Zheng等[12]基于BP神經(jīng)網(wǎng)絡、RBF神經(jīng)網(wǎng)絡和貝葉斯定理構建貝葉斯組合預測模型,結果表明該模型預測結果較好但魯棒性較差。Hong等[13]提出一種基于SVR模型和連續(xù)蟻群優(yōu)化算法(SVRCACO)的城市間交通流短期預測模型,結果表明該模型預測結果優(yōu)于SARIMA模型。趙建立等[14]提出一種基于卷積神經(jīng)網(wǎng)絡(CNN)與殘差網(wǎng)絡(ResNet)的組合預測模型(ResNet-CNN1D),結果表明該模型預測精度更高。林浩等[15]基于遺傳算法(GA)和粒子群算法(PSO)構建GAPSO-SVM模型,實驗顯示GAPSO- SVM模型有較高的預測精度。黃益紹等[16]基于粗糙集(RS)和改進粒子群(IPSO)構建優(yōu)化支持向量機(RS-IPSOSVM)的公交客流預測方法,結果表明該方法簡化了訓練樣本,解決了SVM參數(shù)選擇的盲目性。

        地鐵進站客流是具有一定周期性的時間序列數(shù)據(jù),考慮SARIMA模型預測效果較好且所需數(shù)據(jù)較少,傳統(tǒng)研究一般使用該模型對客流進行預測;而隨著計算機技術的迅猛發(fā)展,且為解決SARIMA模型無法考慮相關因素對進站客流量影響的缺點,越來越多學者選擇使用神經(jīng)網(wǎng)絡等算法預測客流量。考慮神經(jīng)網(wǎng)絡等算法容易出現(xiàn)局部極小化等問題,在已有研究基礎上提出一種基于SARIMA模型和GA-BP神經(jīng)網(wǎng)絡的地鐵進站客流組合預測模型。研究先分別對SARIMA模型和GA-BP神經(jīng)網(wǎng)絡參數(shù)進行標定,在獲取到SARIMA模型和GA-BP神經(jīng)網(wǎng)絡預測值的基礎上,結合SARIMA模型的最大季節(jié)回歸多項式個數(shù)明確組合模型因變量個數(shù)來確定組合模型的權重值,并最終建立線性組合預測模型。

        1 線性組合預測模型建立

        1.1 季節(jié)求和自回歸移動平均模型

        考慮季節(jié)求和自回歸移動平均(SARIMA)模型能夠很好地描述客流量數(shù)據(jù)的趨勢變化和季節(jié)周期特性,且城市地鐵進站客流量屬于周期性的時間序列數(shù)據(jù),因而選擇該模型作為子模型對進站客流預測。SARIMA模型是在自回歸移動平均模型的基礎上考慮到時間序列周期變化的季節(jié)性所帶來不平穩(wěn)現(xiàn)象做出改進,通過對含有季節(jié)性周期的時間序列進行季節(jié)差分的方法將其化為平穩(wěn)序列。SARIMA(p,d,q) (P,D,Q)S計算公式為

        式中:Φ1,Φ2,…,ΦP為季節(jié)自回歸系數(shù);φ1,φ2,…,φp為非季節(jié)自回歸系數(shù);Θ1,Θ2,…,ΘQ為季節(jié)移動平均系數(shù);θ1,θ2,…,θq為非季節(jié)移動平均系數(shù);αt為t時刻的白噪聲;?SD為D階季節(jié)周期為S的差分算子;?d為d階差分算子;xt為過去各期誤差αt,αt-1,…,α1的線性組合;B為滯后算子。

        其中,上述公式所對應的ΦP(BS)為P階季節(jié)自回歸系數(shù)多項式;Φp(B)為p階自回歸多項式;ΘQ(BS)為Q階季節(jié)移動平均多項式;Θq為q階移動平均多項式;為平穩(wěn)的時間序列。

        1.2 GA-BP神經(jīng)網(wǎng)絡模型

        傳統(tǒng)SARIMA模型無法考慮地鐵發(fā)車次數(shù)等因素對進站客流的影響,為研究不同因素對客流的影響,研究選擇使用GA-BP神經(jīng)網(wǎng)絡作為子模型對地鐵客流進行預測。BP神經(jīng)網(wǎng)絡是一種利用梯度下降法使其實際輸出值和期望輸出值誤差均方差為最小的多層前饋神經(jīng)網(wǎng)絡,正因如此BP神經(jīng)網(wǎng)絡預測時容易陷入局部最小值。研究選擇使用遺傳算法(GA)獲取BP神經(jīng)網(wǎng)絡的初始權重值和閾值,降低BP算法陷入局部最小值可能性[17-18], GA-BP算法流程如圖1所示。

        圖1 GA-BP算法流程圖Fig.1 Flow chart of GA-BP algorithm

        模型以累計誤差最小為目標,計算公式為

        式中:E為累計誤差;為BP神經(jīng)網(wǎng)絡預測第i個樣本下第j維變量的預測值;為第i個樣本下第j維變量對應的實際值;l為輸出變量的維數(shù);k為訓練樣本個數(shù)。

        GA-BP神經(jīng)網(wǎng)絡訓練步驟如下。

        (1)步驟1:確定網(wǎng)絡拓撲結構。確定網(wǎng)絡輸入層節(jié)點數(shù)a,隱含層節(jié)點數(shù)b,輸出層節(jié)點數(shù)c,輸入層與隱含層神經(jīng)元之間的連接權值,隱含層與輸出層連接權值,隱含層閾值,輸出層閾值

        (2)步驟2:隨機化初始種群。個體采用實數(shù)編碼方式,由輸入層與隱含層連接權值、隱含層閾值、隱含層與輸出層連接權值以及輸出層閾值4部分組成,具體構成如公式(8)所示。

        (3)步驟3:確定適應度函數(shù)。利用BP神經(jīng)網(wǎng)絡預測結果與實際結果之間誤差的絕對值之和作為個體適應度值f,其計算公式為

        式中:yi為輸出層第i個節(jié)點的預測值;oi為輸出層第i個節(jié)點的實際值。

        (4)步驟4:選擇操作。研究選擇輪盤賭法,通過適應度比例確定個體i的選擇概率pi,計算公式為

        式中:Fi為個體i修正后的適應度值;fi為個體i的適應度值;k1為系數(shù);n為種群個體數(shù)目。

        (5)步驟5:交叉操作。研究選擇實數(shù)交叉法,即第m個染色體gme和第l個染色體gle在e位交叉,交叉的計算公式為

        式中:z為[0,1]區(qū)間的隨機值。

        (6)步驟6:變異操作。選取第i個個體的第e個基因gie進行變異,考慮基因變異是一種隨機現(xiàn)象,采用一個在[0,1]區(qū)間的隨機值r來決定該基因的變異方式,具體變異方式如下。

        式中:gmax為基因gie的上界;gmin為基因gie的下界;r2為一個隨機數(shù);t為當前迭代次數(shù);Tmax為最大迭代次數(shù)。

        (7)步驟7:計算適應度函數(shù)值。如果滿足算法結束條件則輸出優(yōu)化的權值和閾值,反之則返回步驟4。

        (8)步驟8:隱含層計算。隱含層激勵函數(shù)選擇tansig函數(shù),計算公式為

        式中:xi為第i個個體輸入值;αj為第j個系數(shù)。

        (9)步驟9:輸出層計算。

        式中:βk為第k個系數(shù)。

        (10)步驟10:判斷是否滿足結束條件,若不滿足結束條件則返回步驟8。

        1.3 組合預測模型

        盡管利用遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡的初始權值和閾值,但該模型依然存在陷入局部最小值問題。為解決這一問題并提高模型的預測精度,研究在SARIMA模型和GA-BP神經(jīng)網(wǎng)絡預測值的基礎上進一步地修正預測值。研究考慮時間序列季節(jié)性波動的特性,結合SARIMA模型的季節(jié)周期S、季節(jié)自回歸系數(shù)多項式對應階數(shù)P和季節(jié)移動平均多項式對應階數(shù)Q選取某一歷史時間段內的多個子模型預測結果,并根據(jù)其預測精度確定組合預測模型對應的權重值。

        考慮SARIMA模型可以確定該時間序列數(shù)據(jù)是以S個步長為一個季節(jié)周期,其組合預測模型構建的具體思路如下。

        (1)先明確需要預測數(shù)據(jù)在一個季節(jié)周期內的具體位置(如一個星期內的第4位則是星期四),以該位置為原點統(tǒng)計出訓練集最近v個季節(jié)周期內相同位置2個模型的預測值,并計算其對應的平均絕對百分比誤差(MAPE),具體計算公式為

        式中:Rtsa為SARIMA模型預測第t個數(shù)據(jù)的MAPE;Rtbp為GA-BP神經(jīng)網(wǎng)絡預測第t個數(shù)據(jù)的MAPE;Rsa為SARIMA模型在訓練集下的MAPE;Rbp為GA-BP神經(jīng)網(wǎng)絡在訓練集下的MAPE;為 SARIMA模型預測步長為(T+n) -S×i時的預測值;為GA-BP神經(jīng)網(wǎng)絡預測步長為(T+n) -S×i時的預測值;o(T+n)-S×i為第(T+n) -S×i個數(shù)據(jù)的實際值;t為所需要預測數(shù)據(jù)值的序號;n為訓練集的個數(shù);S為季節(jié)周期長度;T為(t-n)與S的余數(shù)。

        (2)為避免MAPE值過小,并讓更小的MAPE模型擁有更大的權重。將子模型MAPE值轉變?yōu)榈箶?shù),再進行歸一化處理后作為組合預測模型的權重值,計算公式為

        式中:wtsa為使用SARIMA模型預測第t個數(shù)據(jù)所對應歸一化值;wtbp為使用GA-BP神經(jīng)網(wǎng)絡預測第t個數(shù)據(jù)所對應歸一化值;wsa為當v= 0時使用SARIMA模型預測第t個數(shù)據(jù)所對應歸一化值;wbp為當v= 0時使用GA-BP神經(jīng)網(wǎng)絡預測第t個數(shù)據(jù)所對應歸一化值。

        (3)結合權重值和子模型的預測值構建線性組合模型,計算公式為

        式中:ytpr為使用組合預測模型預測第t個時刻的預測值;ytsa為使用SARIMA模型預測第t個時刻的預測值;ytbp為使用GA-BP神經(jīng)網(wǎng)絡預測第t個時刻的預測值。

        可以發(fā)現(xiàn),研究構建的組合模型考慮季節(jié)性因素,實質上是對一個季節(jié)周期內每一個時刻都構建一個線性組合預測模型,權重均是以多個其他季節(jié)周期內對應時刻的百分誤差為依據(jù)計算。

        2 實例分析

        2.1 案例數(shù)據(jù)來源

        研究利用2020年7月1日—2020年9月20日(共82 d)哈爾濱南站進站客流數(shù)據(jù)標定模型參數(shù),使用2020年9月21日—2020年9月30日(共10 d)哈爾濱南站進站客流量進行預測。

        2.2 SARIMA模型預測

        通過對數(shù)據(jù)進行1階7步差分消除長期趨勢和季節(jié)性周期影響,再依據(jù)差分后的自相關-偏自相關分析圖反復嘗試建立SARIMA (2,1,2) (1,1,3)7模型,自相關-偏自相關分析圖如圖2所示。模型的擬合優(yōu)度R2值為0.79,SARIMA模型預測結果如表1所示。

        圖2 自相關-偏自相關分析圖Fig.2 Autocorrelation-partial autocorrelation analysis diagram

        表1 SARIMA模型預測結果Tab.1 Prediction of SARIMA model

        2.3 GA-BP神經(jīng)網(wǎng)絡預測

        研究選取每日發(fā)車次數(shù)、是否工作日和周期數(shù)作為輸入變量,并對訓練集的輸入變量和輸出變量進行歸一化處理,消除量綱不統(tǒng)一對模型的影響。

        遺傳算法的參數(shù)設定:總群規(guī)模為25,迭代500次,交叉概率為0.4,變異概率為0.2。

        BP神經(jīng)網(wǎng)絡的參數(shù)設定:隱含層節(jié)點個數(shù)12個,訓練次數(shù)為600次,學習速率為0.125,訓練目標為0.000 05。GA-BP神經(jīng)網(wǎng)絡預測結果如表2所示。研究參考文獻[19]使用校正后的擬合優(yōu)度作為評判標準,其校正擬合優(yōu)度R2值為0.65。

        表2 GA-BP神經(jīng)網(wǎng)絡預測結果Tab.2 Prediction of GA-BP neural network

        2.4 組合模型預測

        首先利用擬合的SARIMA模型和GA-BP神經(jīng)網(wǎng)絡對訓練集進行預測,考慮到SARIMA模型預測需要基于歷史數(shù)據(jù),因而只預測7月18日—9月20日共65 d的數(shù)據(jù)。接著計算2個子模型的MAPE,接著利用公式(19)—(24)計算8月31日—9月20日共21 d (v為3,S為7)每天的MAPE及其倒數(shù)。最后確定組合預測模型所對應子模型的權重值,并得出組合模型的擬合優(yōu)度R2值為0.63,組合模型預測值如表3所示。

        表3 組合模型預測值Tab.3 Predicted value of the combined model

        參考文獻[19],研究設定擬合優(yōu)度和校正擬合優(yōu)度值不低于0.60時通過擬合優(yōu)度檢驗。就R2值而言,SARIMA模型、GA-BP神經(jīng)網(wǎng)絡、組合模型均通過擬合優(yōu)度檢驗。事實上,R2值大小不僅與預測結果相關,還與樣本量的多少存在關系。本研究的訓練樣本為82個,SARIMA模型預測的訓練樣本為65個,GA-BP神經(jīng)網(wǎng)絡預測的訓練樣本為82個,組合模型預測的訓練樣本為44個,這樣計算的R2值無法用于對比分析。為更好地對比分析各模型,選擇組合模型對應的訓練樣本和實際客流值重新計算R2值,得出SARIMA模型為0.80,GA-BP神經(jīng)網(wǎng)絡為0.44,組合模型為0.63??梢园l(fā)現(xiàn),SARIMA模型對于地鐵客流這類周期性的時間序列數(shù)據(jù)預測有著較為明顯的優(yōu)勢;GA-BP神經(jīng)網(wǎng)絡在樣本量較小時擬合優(yōu)度遠低于樣本數(shù)為82個時的R2值,這表明模型的預測波動性較大;組合模型的擬合優(yōu)度介于子模型間,能夠避免單一模型樣本量較少時擬合優(yōu)度過低問題。

        此外,為了更好地研究提出組合模型的效果,研究加入一個傳統(tǒng)的線性組合預測模型(以下簡稱“組合模型0”)。該模型不同于組合模型根據(jù)一定規(guī)則挑選部分預測值的MAPE值作為其權重值的確定依據(jù),組合模型0是以SARIMA模型和GA-BP神經(jīng)網(wǎng)絡所有預測值的百分誤差之和作為其權重值確定依據(jù),其計算公式為

        式中:R0,sa,R0,bp為SARIMA和GA-BP神經(jīng)網(wǎng)絡的MAPE值;w0,sa,w0,bp為組合模型0的SARIMA和GA-BP神經(jīng)網(wǎng)絡的權重值。

        組合模型0的預測結果如表4所示。

        表 4 組合模型0的預測結果Tab.4 Prediction of combined model 0

        2.5 模型結果分析

        研究統(tǒng)計子模型與組合預測模型的百分誤差并計算得出預測不同個數(shù)下的MAPE,各模型的百分誤差和MAPE如表5所示,對應的百分誤差和MAPE折線圖如圖3所示。

        結合表5和圖3可以發(fā)現(xiàn),子模型的百分誤差上下波動較大,組合模型介于兩者之間,這表明組合模型有效緩解單一模型預測時出現(xiàn)波動較大的可能性。其中,組合預測模型的百分誤差始終處于子模型之間,這表明組合預測模型的預測精度取決于子模型的預測精度,只有當所有子模型預測精度達到同一水平時組合預測模型的預測精度相對較高,組合預測模型并不能在子模型的基礎上進一步提升其預測精度。通過對比組合模型0的百分誤差可以發(fā)現(xiàn),預測的10個數(shù)據(jù)中僅有2個預測值不如組合模型0,這表明研究提出的組合模型優(yōu)于組合模型0。

        圖3 百分誤差和MAPE折線圖Fig.3 Line charts of percentage error and MAPE

        表5 各模型的百分誤差和MAPETab.5 Percentage error and MAPE of varied models

        通過觀察各模型的MAPE、百分誤差可以發(fā)現(xiàn),MAPE值隨著預測個數(shù)增加不斷提高,但各模型MAPE值均不高于10%,且組合模型隨著預測個數(shù)的增加,MAPE值增長速率越低,這表明組合模型長期預測效果較好。其中,SARIMA模型在短期預測(≤5 d)時預測精度較差,但是在長期預測(>5 d)時均高于GA-BP神經(jīng)網(wǎng)絡;GA-BP神經(jīng)網(wǎng)絡在短期預測時預測精度高于SARIMA模型,但在長期預測時預測精度不如SARIMA模型;組合模型0無論在長期還是短期預測中,預測精度大體介于子模型之間;組合預測模型在短期預測中受限于預測個數(shù)過少緣故,預測精度一直介于子模型之間,但在長期預測時組合預測模型的預測精度好于所有子模型,當預測個數(shù)大于2個時,組合模型的預測精度高于組合模型0。

        3 結論

        (1)研究從數(shù)據(jù)驅動的角度提出一種利用SARIMA模型確定未來客流受某一或多個特定歷史客流影響的方法,同時構建了考慮發(fā)車班次等因素的GA-BP神經(jīng)網(wǎng)絡模型對客流預測,并在此基礎上提出了一種既考慮歷史地鐵進站客流對未來的影響又考慮發(fā)車班次、是否工作日等因素對客流影響的組合預測模型。

        (2)在擬合優(yōu)度方面,研究提出的組合預測模型擬合優(yōu)度值雖然介于子模型之間,但是能夠避免單一模型在樣本量較少的情況下擬合優(yōu)度過低無法通過檢驗的問題,這表明研究提出的組合預測模型能夠較好地兼容不同的樣本量。

        (3)在預測結果方面,研究提出的組合預測模型在短期預測中平均預測精度介于子模型之間,但在長期預測過程中其平均預測精度優(yōu)于所有子模型,這表明研究提出的組合模型更適合用于長期預測。此外,研究提出的組合模型預測精度高于組合模型0,這表明線性組合模型0并不適用于地鐵進站客流預測。

        猜你喜歡
        模型
        一半模型
        一種去中心化的域名服務本地化模型
        適用于BDS-3 PPP的隨機模型
        提煉模型 突破難點
        函數(shù)模型及應用
        p150Glued在帕金森病模型中的表達及分布
        函數(shù)模型及應用
        重要模型『一線三等角』
        重尾非線性自回歸模型自加權M-估計的漸近分布
        3D打印中的模型分割與打包
        欧美俄罗斯乱妇| 国产精品一区二区三区专区| 三年的高清电影免费看| 日韩成人无码一区二区三区| 亚洲老熟妇愉情magnet| 在线看高清中文字幕一区| 国产麻花豆剧传媒精品mv在线 | 97久久综合区小说区图片专区| a级三级三级三级在线视频| 日本真人边吃奶边做爽电影| 国模少妇一区二区三区| 国产在视频线精品视频二代 | 精品人妻丰满久久久a| av一区二区三区观看| 国产av无码国产av毛片| 抽插丰满内射高潮视频| 国产精品亚洲一区二区极品| 亚洲国产一区二区三区精品| 天堂а√在线最新版中文在线| 福利一区二区三区视频午夜观看| 国产三级精品三级在线| 亚洲乱码无人区卡1卡2卡3| 熟妇人妻av无码一区二区三区| 中文字幕大乳少妇| 亚洲一区二区国产一区| 国偷自产视频一区二区久| 国产97色在线 | 免| 免费av在线 国产精品| 久久99国产精品久久| 美丽人妻被按摩中出中文字幕 | 国产精品成人免费视频一区| 人妻丰满熟妇AV无码区HD| 日本红怡院东京热加勒比| 久久国产精品一区二区三区| 无码人妻黑人中文字幕| 国产视频嗯啊啊啊| 亚洲国产精品成人av在线不卡| 中文字幕亚洲乱码熟女在线 | 国产精品妇女一区二区三区| 中文字幕av一区中文字幕天堂| 国产成人精品男人的天堂网站|