郭婷婷,宇世航
基于修正動(dòng)態(tài)組合模型對公共交通客運(yùn)量的預(yù)測
郭婷婷,宇世航
(齊齊哈爾大學(xué) 理學(xué)院,黑龍江 齊齊哈爾 161006)
針對公共交通客運(yùn)量的預(yù)測問題,結(jié)合ARIMA、灰色預(yù)測以及BP神經(jīng)網(wǎng)絡(luò)的優(yōu)勢,采用臨近期的誤差平方和來計(jì)算動(dòng)態(tài)權(quán)重,將突發(fā)事件定義為影響因子,建立了修正動(dòng)態(tài)加權(quán)組合模型.選取北京市1978—2021年公共交通客運(yùn)量進(jìn)行實(shí)證分析.實(shí)證分析結(jié)果表明,修正動(dòng)態(tài)加權(quán)組合模型的預(yù)測效果比單一模型和固定權(quán)重組合模型更好.
公共交通客運(yùn)量;修正動(dòng)態(tài)組合模型;ARIMA模型;灰色預(yù)測模型;BP神經(jīng)網(wǎng)絡(luò)模型;突發(fā)事件
城市公共交通客運(yùn)量是城市公共交通規(guī)劃的重要依據(jù),也是確定行車計(jì)劃,經(jīng)濟(jì)合理地使用車輛,改善提高公共交通質(zhì)量所不可缺少的數(shù)據(jù).城市公共交通是指在城市人民政府確定的區(qū)域內(nèi)的公共汽(電)車(含有軌電車)、城市軌道交通系統(tǒng)和有關(guān)設(shè)施.城市公共交通是城市基礎(chǔ)設(shè)施的重要組成部分,對城市政治經(jīng)濟(jì)、文化教育和科學(xué)技術(shù)等方面的發(fā)展影響極大,也是城市建設(shè)的一個(gè)非常重要的方面.發(fā)展城市交通不僅是緩解城市交通擁堵的有效措施,也是改善城市居住環(huán)境,促進(jìn)城市可持續(xù)發(fā)展的必然要求.
新冠肺炎疫情對于我國各行各業(yè)都產(chǎn)生了不小的影響,其中公共交通運(yùn)輸業(yè)也受到了很大的沖擊.公共交通運(yùn)輸業(yè)屬于國民基礎(chǔ)產(chǎn)業(yè),在社會再生產(chǎn)過程中起到先導(dǎo)性和戰(zhàn)略性作用.對于交通運(yùn)輸業(yè)來說,建立有效應(yīng)對突發(fā)狀況的體系,降低突發(fā)事件對交通運(yùn)輸?shù)挠绊?,保障公共交通運(yùn)輸?shù)恼_\(yùn)行至關(guān)重要.因此,在預(yù)測客運(yùn)量的過程中應(yīng)考慮突發(fā)事件帶來的影響,單純依靠時(shí)間序列的預(yù)測會導(dǎo)致結(jié)果偏離實(shí)際情況.
目前,對于公共交通客運(yùn)量的預(yù)測研究國內(nèi)外學(xué)者已經(jīng)進(jìn)行了大量的工作,但多數(shù)集中于單一模型的研究.文獻(xiàn)[1]使用網(wǎng)絡(luò)克里金法估計(jì)乘客量,用網(wǎng)絡(luò)距離來反映地鐵站只通過地鐵隧道連接的事實(shí).徐文遠(yuǎn)[2]等對公共交通客運(yùn)量的影響因素進(jìn)行分析,建立ARMA時(shí)間序列模型對公交客流量進(jìn)行擬合和預(yù)測.丁聰[3]等基于梯度提升和隨機(jī)森林的混合模型對日均客流量進(jìn)行預(yù)測,發(fā)現(xiàn)此模型相較于常規(guī)ARIMA模型和隨機(jī)森林模型具有更好的適應(yīng)性.王瑩[4]等總結(jié)北京地鐵進(jìn)站客流量的波動(dòng)規(guī)律,選用季節(jié)時(shí)間序列模型對北京地鐵進(jìn)站客流量進(jìn)行時(shí)間序列建模.盧小蘭[5]等使用Holt-Winters模型和SARIMA模型分別預(yù)測鐵路的月度客運(yùn)量,并構(gòu)建組合預(yù)測模型.張健[6]等采用一種時(shí)空模型平均方法,有效地降低了由于航空客運(yùn)量的結(jié)構(gòu)性變化和預(yù)測模型不確定性等導(dǎo)致的預(yù)測風(fēng)險(xiǎn),進(jìn)而做出精準(zhǔn)而穩(wěn)定的客運(yùn)量預(yù)測.近年來,組合模型被廣泛地應(yīng)用于各種預(yù)測問題中[7],組合模型能夠結(jié)合單一模型的優(yōu)點(diǎn),避免其局限性.關(guān)于突發(fā)事件方面,汪志紅[8]基于新冠肺炎疫情對日常生活的影響構(gòu)建了ARIMAX干預(yù)模型,模型顯示我國鐵路客運(yùn)正在緩慢持續(xù)回暖.
為檢驗(yàn)?zāi)P偷臏?zhǔn)確性,使用關(guān)聯(lián)度檢驗(yàn)法、后驗(yàn)差比值和小誤差概率檢驗(yàn)灰色預(yù)測模型的效果.
神經(jīng)網(wǎng)絡(luò)方法是一種具有高度靈活性的非線性擬合方法,理論上可以擬合任何函數(shù),并且達(dá)到非常高的擬合精度[10].BP神經(jīng)網(wǎng)絡(luò)是一種按誤差反向傳播(簡稱誤差反傳)訓(xùn)練的多層前饋網(wǎng)絡(luò),它的基本思想是梯度下降法,利用梯度搜索技術(shù),以期使網(wǎng)絡(luò)的實(shí)際輸出值和期望輸出值的誤差均方差為最小.
BP神經(jīng)網(wǎng)絡(luò)是在輸入層與輸出層之間增加若干層神經(jīng)元(見圖1),它們與外界沒有直接關(guān)系,但它的狀態(tài)可以改變,從而影響輸入層與輸出層之間的關(guān)系.其過程主要分為2個(gè)階段,第1階段是信號的前向傳播,從輸入層經(jīng)過隱含層,最后到達(dá)輸出層;第2階段是誤差的反向傳播,從輸出層到隱含層,最后到輸入層,依次調(diào)節(jié)隱含層到輸出層的權(quán)重和偏置,輸入層到隱含層的權(quán)重和偏置.神經(jīng)網(wǎng)絡(luò)的擬合過程就是不斷地優(yōu)化連接相應(yīng)層神經(jīng)元之間的參數(shù).
圖1 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
為了加快訓(xùn)練速度,避免陷入局部最小值和改善其他能力,學(xué)習(xí)算法可采用帶動(dòng)量的批處理梯度下降法[11].
1.4.2 影響因子新冠肺炎疫情作為突發(fā)公共衛(wèi)生事件,從多個(gè)渠道給經(jīng)濟(jì)運(yùn)行帶來負(fù)面影響.公共交通客運(yùn)量能夠直觀地反映出此次突發(fā)事件對于人民生活的影響.
采取線性回歸將新冠疫情對公共交通客運(yùn)量的影響描述出來,之后對正常情況下的公共交通客運(yùn)量進(jìn)行預(yù)測,根據(jù)不同月份公共交通客運(yùn)量的占比,計(jì)算出月度公共交通客運(yùn)量的預(yù)測值,通過對比,可以得出新冠疫情對公共交通客運(yùn)量的影響值,影響值可以用于修正預(yù)測模型,更準(zhǔn)確地預(yù)測突發(fā)事件影響下的公共交通客運(yùn)量.具體計(jì)算公式為
文中使用的1978—2021年北京市公共交通客運(yùn)量數(shù)據(jù)來源于北京市統(tǒng)計(jì)年鑒,新冠肺炎病例數(shù)據(jù)來源于銳思數(shù)據(jù)庫 (www.resset.com).
對數(shù)據(jù)進(jìn)行預(yù)測,利用Forecast中的ARIMA函數(shù)進(jìn)行預(yù)測分析,結(jié)果見圖2,其中1~39期分別為1978—2016年,向后1~3期分別為2017—2019年,其公共交通客運(yùn)量預(yù)測值均為734 953萬人,預(yù)測誤差平方和在0.002 6~0.009 6之間,模型預(yù)測情況良好.
圖2 ARIMA模型公共交通客運(yùn)量預(yù)測擬合
2014—2018年公共交通客運(yùn)量的預(yù)測值和真實(shí)值擬合程度良好(見圖3),公共交通客運(yùn)量的預(yù)測值分別為815 849,741 482,728 763.1,716 262.3,703 975.9萬人.
圖3 GM(1,1)灰色模型公共交通客運(yùn)量預(yù)測擬合
訓(xùn)練數(shù)據(jù)為1999—2016年的歸一化數(shù)據(jù),預(yù)測數(shù)據(jù)為2017—2019年的歸一化數(shù)據(jù),根據(jù)輸入節(jié)點(diǎn)的不同調(diào)整輸入數(shù)據(jù),輸出數(shù)據(jù)為1999—2019年的數(shù)據(jù).采用的BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法為LM(Leneberg-Marquardt)算法,設(shè)定網(wǎng)絡(luò)的最大訓(xùn)練次數(shù)為1 000,學(xué)習(xí)速率為0.01,訓(xùn)練目標(biāo)誤差為0.01.
一般情況下,隱含層節(jié)點(diǎn)數(shù)大于輸入層節(jié)點(diǎn)數(shù),網(wǎng)絡(luò)結(jié)構(gòu)的穩(wěn)定性比較好,但當(dāng)隱含層節(jié)點(diǎn)數(shù)為輸入層節(jié)點(diǎn)數(shù)的4倍以上時(shí),網(wǎng)絡(luò)會出現(xiàn)過擬合和穩(wěn)定性變差的情況.當(dāng)輸入層節(jié)點(diǎn)數(shù)為3,隱含層節(jié)點(diǎn)數(shù)為4時(shí),平均相對誤差最小,為0.004 2,BP神經(jīng)網(wǎng)絡(luò)的穩(wěn)定性較好,可以獲得較好的結(jié)果.
使用訓(xùn)練好的BP神經(jīng)網(wǎng)絡(luò)模型對2017—2019年的公共交通客運(yùn)量進(jìn)行預(yù)測,結(jié)果分別為713 020,709 960,712 160萬人.驗(yàn)證樣本的平均誤差率為0.00 428,與單個(gè)誤差率均小于目標(biāo)誤差0.01.
3種模型的預(yù)測結(jié)果表明,直至2019年,預(yù)測的精度都是良好的,但自2020年開始,預(yù)測值與真實(shí)值的誤差急劇增大(見圖5).這是由于在2020—2021年期間,因?yàn)樾鹿诜窝滓咔榈挠绊?,公共交通客運(yùn)量大幅度降低,因此在接下來的預(yù)測過程中,應(yīng)考慮這一突發(fā)事件給公共交通客運(yùn)量帶來的影響,對模型進(jìn)行修正.
圖4 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練集的預(yù)測值與實(shí)際值
圖5 3種單一模型2020—2021年公共交通客運(yùn)量的預(yù)測值與真實(shí)值
表1 前3年的預(yù)測誤差平方和
表2 2017—2019年動(dòng)態(tài)組合模型的權(quán)重
根據(jù)表2計(jì)算的動(dòng)態(tài)權(quán)重系數(shù),得出的動(dòng)態(tài)組合預(yù)測模型為
使用組合模型預(yù)測2017—2019年的公共交通客運(yùn)量,預(yù)測結(jié)果及相對誤差見表3.
表3 動(dòng)態(tài)組合模型公共交通客運(yùn)量預(yù)測結(jié)果及相對誤差
4種模型公共交通客運(yùn)量的預(yù)測值與真實(shí)值對比見圖6.
圖6?。捶N模型的公共交通客運(yùn)量預(yù)測值與真實(shí)值
組合模型的相對誤差小于其他3種單一模型的相對誤差,由圖6也可以看出,組合模型的擬合效果優(yōu)于其他3種單一模型,集合了3種模型的優(yōu)點(diǎn),降低單一模型的局限性.因此選用組合模型預(yù)測2020—2021年沒有新冠疫情的情況下可以達(dá)到的公共交通客運(yùn)量,并以此結(jié)果計(jì)算對比出新冠疫情對公共交通客運(yùn)量的影響.
根據(jù)3種模型的預(yù)測結(jié)果,計(jì)算預(yù)測誤差平方和(見表4),確定動(dòng)態(tài)組合模型的權(quán)重(見表5),利用動(dòng)態(tài)組合預(yù)測模型公式,計(jì)算出2020—2021年的公共交通客運(yùn)量預(yù)測值.
表4 3種模型的預(yù)測誤差平方和
表5 2020—2021年動(dòng)態(tài)組合模型的權(quán)重
根據(jù)動(dòng)態(tài)組合預(yù)測模型公式(6),可計(jì)算得出2020年和2021年的公共交通客運(yùn)量預(yù)測值分別為717 778.496,722 946.764 6萬人,而實(shí)際上2020年和2021年北京市實(shí)際公共交通客運(yùn)量只有411 967,557 708萬人,可見疫情對公共交通的影響巨大.
2.4.2 影響因子研究表明,北京市公共交通客運(yùn)量受到了疫情的影響,假設(shè)其他的影響因素未發(fā)生改變,只考慮新冠疫情對公共交通客運(yùn)量的影響.使用2020-01—2022-03每月新冠確診新增人數(shù)作為影響因素對公共交通客運(yùn)量做線性回歸,結(jié)果見表6.
表6 月公共交通客運(yùn)量線性回歸結(jié)果
注:**表示在1%顯著水平下非常顯著.
由表6可以看出,每月新冠確診新增人數(shù)對月公共交通客運(yùn)量的線性回歸模型公式為
為了更詳細(xì)地反映出新冠疫情對于公共交通客運(yùn)量的影響情況,以及對預(yù)測值進(jìn)行修正,進(jìn)一步探討2020—2021年的月度公共交通客運(yùn)量預(yù)測值.由動(dòng)態(tài)組合模型得出預(yù)測值,計(jì)算2020—2021年每個(gè)月公共交通客運(yùn)量占當(dāng)年公共交通客運(yùn)量的占比的平均值,得出每個(gè)月的預(yù)測值,從而計(jì)算出新冠疫情對公共客運(yùn)量的影響值,具體結(jié)果為
2021年每月的公共交通客運(yùn)量預(yù)測值以及影響值見表7.
表7 2021年新冠疫情對月公共交通客運(yùn)量影響
由表7可以看出,在新冠疫情的影響下,2021年的北京市公共交通客運(yùn)量隨之產(chǎn)生衰減,1月時(shí),本應(yīng)因春運(yùn)而上升的公共交通客運(yùn)量,由于出現(xiàn)大量新增病例,而導(dǎo)致當(dāng)期公共交通客運(yùn)量較以往春運(yùn)期間公共交通客運(yùn)量出現(xiàn)很大程度的下跌;2~5月,由于新增人數(shù)非常少,公共交通客運(yùn)量出現(xiàn)了上升趨勢;5~12月國家出臺應(yīng)對疫情的相應(yīng)政策,為響應(yīng)國家號召,人們盡量減少出行,這也導(dǎo)致了公共交通客運(yùn)量相對以往年份減少較為明顯.
[1] ZHANG D P,WANG X K.Transit ridership estimation with network Kriging:a case study of Second Avenue Subway,NYC[J].Journal of Transport Geography,2014(41):107-115.
[2] 徐文遠(yuǎn),鄧春瑤.公交客運(yùn)量的時(shí)間序列預(yù)測模型[J].遼寧工程技術(shù)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014,33(12):1715-1720.
[3] 丁聰,倪少權(quán),呂紅霞.基于梯度提升的城市軌道交通客流量預(yù)測分析[J].城市軌道交通研究,2018,21(9):60-63.
[4] 王瑩,韓寶明,張琦,等.基于SARIMA模型的北京地鐵進(jìn)站客流量預(yù)測[J].交通運(yùn)輸系統(tǒng)工程與信息,2015,15(6):205-215.
[5] 盧小蘭,張可心.基于IOWGA算子的鐵路月度客運(yùn)量的組合預(yù)測[J].?dāng)?shù)學(xué)的實(shí)踐與認(rèn)識,2020,50(6):120-131.
[6] 張健,孫玉瑩,張新雨,等.基于時(shí)變模型平均方法的我國航空客運(yùn)量預(yù)測[J].系統(tǒng)工程理論與實(shí)踐,2020,40(6):1509-1519.
[7] 孫彩云,劉翔宇.基于動(dòng)態(tài)組合模型對河北省人均GDP的預(yù)測研究[J].?dāng)?shù)理統(tǒng)計(jì)與管理,2022(5):1-10.
[8] 汪志紅.突發(fā)事件對我國鐵路客運(yùn)量的干預(yù)特征研究[J].鐵道運(yùn)輸與經(jīng)濟(jì),2022,44(1):44-51.
[9] 楊婉瑩.新冠肺炎對交通運(yùn)輸業(yè)影響的預(yù)測與分析[J].中國市場,2021(27):136-137.
[10] 王方.基于神經(jīng)網(wǎng)絡(luò)的2020年奧運(yùn)會獎(jiǎng)牌成績預(yù)測[J].統(tǒng)計(jì)與決策,2019,35(5):89-91.
[11] 馮樹民,慈玉生.居民出行產(chǎn)生量BP神經(jīng)網(wǎng)絡(luò)預(yù)測方法[J].哈爾濱工業(yè)大學(xué)學(xué)報(bào),2010,42(10):1624-1627.
[12] 馮增喜,任慶昌.基于動(dòng)態(tài)組合殘差修正的預(yù)測方法[J].系統(tǒng)工程理論與實(shí)踐,2017,37(7):1884-1891.
Forecast of public transport passenger volume based on modified dynamic combination model
GUO Tingting,YU Shihang
(School of Science,Qiqihar University,Qiqihar 161006,China)
Aiming at the forecasting problem of public transport passenger volume,combining the advantages of ARIMA,grey prediction and BP neural network,the dynamic weight is calculated by the sum of the squares of errors in the near period,the modified dynamic weighted combination model is established by defining emergency events as impact factors.The public transport passenger volume of Beijing from 1978 to 2021 is selected for empirical analysis.The empirical analysis results show that the modified dynamic weighted combination model has better prediction effect than the single model and the fixed weight combination model.
public transport passenger volume;modified dynamic combination model;ARIMA model;grey predictive model;Back-propagation neural network model;emergency event
1007-9831(2023)01-0031-07
TP18
A
10.3969/j.issn.1007-9831.2023.01.007
2022-09-09
黑龍江省自然科學(xué)基金項(xiàng)目(LH2019A027)
郭婷婷(1998-),女,黑龍江齊齊哈爾人,在讀碩士研究生,從事時(shí)間序列分析研究.E-mail:13895966506@163.com
宇世航(1971-),女,黑龍江齊齊哈爾人,教授,博士,從事整值時(shí)間序列和復(fù)雜數(shù)據(jù)統(tǒng)計(jì)推斷研究.E-mail:qqhrysh@163.com