錢名軍,李引珍,阿茹娜
(1.蘭州交通大學(xué) 交通運(yùn)輸學(xué)院,甘肅 蘭州 730070; 2.中國(guó)中鐵股份有限公司 規(guī)劃發(fā)展部, 北京 100039)
鐵路客運(yùn)系統(tǒng)作為一個(gè)與外界頻繁進(jìn)行能量、信息交換的典型的開放、動(dòng)態(tài)、非線性復(fù)雜巨系統(tǒng),其客運(yùn)量時(shí)間序列是該系統(tǒng)運(yùn)轉(zhuǎn)所產(chǎn)生的外在表現(xiàn)數(shù)據(jù)。它蘊(yùn)含了旅客運(yùn)輸過(guò)程中的大量信息,是各種因素對(duì)鐵路客流綜合作用的結(jié)果,呈現(xiàn)出復(fù)雜的變化趨勢(shì)和波動(dòng)特性。因此,有必要深入研究鐵路客運(yùn)量時(shí)間序列,從中提取并利用有關(guān)規(guī)律信息,為鐵路客運(yùn)部門靈活制定列車開行計(jì)劃、合理配置和運(yùn)用客車車底,提高客運(yùn)服務(wù)質(zhì)量乃至科學(xué)制定路網(wǎng)規(guī)劃建設(shè)方案等提供決策參考。
當(dāng)前,對(duì)客運(yùn)量時(shí)間序列的預(yù)測(cè)研究,主要運(yùn)用神經(jīng)網(wǎng)絡(luò)[1-2]、機(jī)器學(xué)習(xí)[3-5]、混沌理論[6]、ARIMA(Auto-Regressive Integrated Moving Average)模型[7-8]、灰色理論[9]、馬爾科夫模型[9-10]或卡爾曼濾波等技術(shù)方法來(lái)提高對(duì)數(shù)據(jù)的擬合精度。文獻(xiàn)[1]提出了消除高鐵節(jié)假日影響的數(shù)據(jù)替補(bǔ)修正法和融合變分模態(tài)分解(VMD)、遺傳算法(GA)及BP神經(jīng)網(wǎng)絡(luò)的VMD-GA-BP客運(yùn)量預(yù)測(cè)法。文獻(xiàn)[3]提出一種基于深度學(xué)習(xí)與神經(jīng)網(wǎng)絡(luò)相結(jié)合的小時(shí)客流預(yù)測(cè)模型SAE-DNN,并將其應(yīng)用于廈門市BRT公交站的客流預(yù)測(cè)。文獻(xiàn)[6]將相空間重構(gòu)方法用于對(duì)與鐵路運(yùn)量相關(guān)的時(shí)間序列進(jìn)行混沌特性識(shí)別,并采用最大Lyapunov指數(shù)預(yù)測(cè)方法對(duì)鐵路客貨運(yùn)量進(jìn)行預(yù)測(cè)分析。文獻(xiàn)[7]針對(duì)移動(dòng)假日對(duì)鐵路客運(yùn)量的雙峰影響,采用X-12-ARIMA季節(jié)調(diào)整模型,建立鐵路客運(yùn)量的三時(shí)段春節(jié)季節(jié)調(diào)整模型,取得了較好效果。文獻(xiàn)[8]針對(duì)北京地鐵進(jìn)站客流呈現(xiàn)以“周”為周期的波動(dòng)規(guī)律,采用了SARIMA季節(jié)時(shí)間序列模型進(jìn)行預(yù)測(cè)。文獻(xiàn)[10]將指數(shù)平滑法與馬爾科夫模型綜合用于公路客運(yùn)量預(yù)測(cè)。可見,現(xiàn)有客運(yùn)量預(yù)測(cè)研究或側(cè)重于對(duì)宏觀的年度增減趨勢(shì)進(jìn)行預(yù)測(cè),或側(cè)重于對(duì)相對(duì)微觀的節(jié)假日、周、日客運(yùn)量進(jìn)行預(yù)測(cè),而對(duì)中觀層面的月度或季度客運(yùn)量變化規(guī)律及特點(diǎn)的研究不夠深入。
伴隨經(jīng)濟(jì)和社會(huì)的快速發(fā)展,人們的出行需求更加多元化、動(dòng)態(tài)化,為及時(shí)響應(yīng)旅客需求的快速變化以適應(yīng)客運(yùn)市場(chǎng)的激烈競(jìng)爭(zhēng),鐵路客運(yùn)組織計(jì)劃在保持運(yùn)能與運(yùn)需基本均衡的前提下需具備一定的靈活性。而目前鐵路部門在制定旅客運(yùn)輸計(jì)劃時(shí)大多參照年度客流數(shù)據(jù)進(jìn)行決策,對(duì)月度或季度客流所反映出來(lái)的短期波動(dòng)變化響應(yīng)不夠及時(shí)。年度客流數(shù)據(jù)雖然能較好地反映鐵路客運(yùn)市場(chǎng)中長(zhǎng)期的變化趨勢(shì),但時(shí)間跨度仍然較大,在一定程度上掩蓋了一年中不同月份客運(yùn)量的季節(jié)性、周期性和隨機(jī)波動(dòng)性,不利于客運(yùn)組織部門及時(shí)靈活地調(diào)整旅客列車開行計(jì)劃、機(jī)車車輛運(yùn)用計(jì)劃等以適應(yīng)月度客運(yùn)市場(chǎng)的相應(yīng)變化。
實(shí)際上,鐵路月度或季度客運(yùn)量在受鐵路自身運(yùn)能影響的同時(shí),還與近期國(guó)民經(jīng)濟(jì)發(fā)展?fàn)顟B(tài)、季節(jié)氣候以及其他交通方式的相互作用有關(guān),具有明顯的中長(zhǎng)期變化趨勢(shì)性和周期性;同時(shí)又因移動(dòng)節(jié)假日效應(yīng)或突發(fā)重大事件的存在,而具有顯著的隨機(jī)波動(dòng)性。因此,對(duì)月度客運(yùn)量變化規(guī)律進(jìn)行研究具有重要的現(xiàn)實(shí)意義。文獻(xiàn)[11]針對(duì)鐵路月度客運(yùn)量序列中存在的趨勢(shì)成分和季節(jié)成分構(gòu)建出SARIMA(2,1,1)(0,1,0)12模型,其預(yù)測(cè)精度較Excel趨勢(shì)線法、XGBOOST算法略有提高,但預(yù)測(cè)效果仍不算理想。主要原因在于,該SARIMA模型定階不夠準(zhǔn)確,且關(guān)鍵是對(duì)序列中存在的非線性波動(dòng)成分(即ARCH異方差效應(yīng))未予以考慮并進(jìn)行有效提取。
基于此,本文以鐵路月度客運(yùn)量時(shí)間序列為研究對(duì)象,首先,對(duì)其趨勢(shì)性、季節(jié)性和隨機(jī)性進(jìn)行季節(jié)分解,并通過(guò)季節(jié)、非季節(jié)差分序列的相關(guān)圖識(shí)別篩選出擬合優(yōu)度更高的SARIMA基礎(chǔ)模型。然后,為消除異方差、提高模型預(yù)測(cè)精度,再對(duì)SARIMA基礎(chǔ)模型的回歸殘差進(jìn)行GARCH效應(yīng)建模,得到SARIMA(2,1,1)(1,1,1)12-GARCH(1,1)融合模型。最后,對(duì)融合模型的穩(wěn)定性及預(yù)測(cè)性能進(jìn)行檢驗(yàn)、分析。
研究表明,鐵路月度客運(yùn)量時(shí)間序列具有非平穩(wěn)、非線性、周期性以及存在異方差性,為此將SARIMA模型與GARCH模型進(jìn)行融合建模[12-13],以提高預(yù)測(cè)精度。
SARIMA從自回歸差分移動(dòng)平均模型ARIMA衍生而來(lái)[7]。該模型通過(guò)對(duì)非平穩(wěn)時(shí)間序列進(jìn)行差分轉(zhuǎn)化為平穩(wěn)時(shí)間序列后,將因變量?jī)H對(duì)它的滯后項(xiàng)及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸來(lái)構(gòu)建模型,很適合非平穩(wěn)單變量時(shí)間序列的預(yù)測(cè)。
若某時(shí)間序列經(jīng)s個(gè)時(shí)間間隔后觀測(cè)值呈現(xiàn)出相似性,如同時(shí)出現(xiàn)波峰或波谷狀態(tài),則稱該序列是以s為周期的季節(jié)時(shí)間序列。令周期為s的非平穩(wěn)季節(jié)時(shí)間序列(包括日、周、月或季度序列)為{Yt}(t為時(shí)間序列樣本長(zhǎng)度),則其經(jīng)d階非季節(jié)差分、p階自回歸、q階移動(dòng)平均的ARIMA(p,d,q)模型為
ΔdYt=c+α1ΔdYt-1+α2ΔdYt-2+…+
αpΔdYt-p+ut+β1ut-1+β2ut-2+…+βqut-q
(1)
式中:c為常數(shù)項(xiàng);α1,α2,…,αp為自回歸系數(shù);β1,β2,…,βq為移動(dòng)平均系數(shù);ut為隨機(jī)擾動(dòng)項(xiàng)。
式(1)右邊前半部分為自回歸過(guò)程,后半部分為移動(dòng)平均過(guò)程。
顯然,式(1)等價(jià)于
ΔdYt-α1ΔdYt-1-α2ΔdYt-2-…-αpΔdYt-p=
c+ut+β1ut-1+β2ut-2+…+βqut-q
(2)
引入滯后算子L,可以得到
LΔdYt=ΔdYt-1
LnΔdYt=ΔdYt-n
式中:n為任意正整數(shù)。
特別地L0ΔdYt=ΔdYt。
則式(2)可寫為
(1-α1L-α2L2-…-αpLp)ΔdYt=
c+(1+β1L+β2L2+…+βqLq)ut
(3)
令平穩(wěn)的自回歸算子
Φp(L)=1-α1L-α2L2-…-αpLp
可逆的移動(dòng)平均算子
Θq(L)=1+β1L+β2L2+…+βqLq
代入式(3)即得ARIMA(p,d,q)簡(jiǎn)式
Φp(L)ΔdYt=c+Θq(L)ut
(4)
同時(shí),定義季節(jié)差分算子Δs=1-Ls,則一次季節(jié)差分表示為
ΔsYt=(1-Ls)Yt=Yt-LsYt=Yt-Yt-s
(5)
對(duì)于非平穩(wěn)季節(jié)性時(shí)間序列,需經(jīng)D階季節(jié)差分來(lái)消除季節(jié)性影響,才可建立周期為s的P階自回歸、Q階移動(dòng)平均季節(jié)時(shí)間序列模型
(6)
式中:AP(Ls)、BQ(Ls)分別為非平穩(wěn)季節(jié)時(shí)間序列的自回歸算子與移動(dòng)平均算子。
當(dāng)式(6)的隨機(jī)擾動(dòng)項(xiàng)ut非平穩(wěn)且存在自回歸(Auto-Regressive, AR)或移動(dòng)平均(Moving Average, MA)成分時(shí),再對(duì)ut建立ARIMA(p,d,q)模型
Φp(L)Δdut=Θq(L)vt
(7)
式中:vt為白噪聲。
把式(7)代入式(6),即得SARIMA(p,d,q)×(P,D,Q)s模型
(8)
顯然,當(dāng)P=D=Q=0時(shí),SARIMA(p,d,q)×(P,D,Q)s模型退化為ARIMA(p,d,q)模型,因此說(shuō)ARIMA是SARIMA的特例。當(dāng)p=d=q=P=D=Q=0時(shí),SARIMA模型退化為白噪聲模型。
通常,非平穩(wěn)時(shí)間序列模型的方差不僅隨時(shí)間變化,而且有時(shí)變化劇烈,表現(xiàn)出“波動(dòng)集聚(Volatility Clustering)”特征,即方差在一些時(shí)段比較小,而在另一些時(shí)段會(huì)比較大。這種現(xiàn)象就說(shuō)明模型殘差存在異方差效應(yīng)(ARCH)。當(dāng)存在ARCH效應(yīng)時(shí),有必要對(duì)異方差進(jìn)行正確處理以使回歸參數(shù)的估計(jì)量更具顯著性,避免異方差對(duì)時(shí)序模型產(chǎn)生不良影響,從而提高模型的預(yù)測(cè)精度。GARCH模型可以用于對(duì)解釋變量的方差建模,以提高均值方程參數(shù)估計(jì)的有效性。
GARCH(p,q)由ARCH(q)模型擴(kuò)展而來(lái)[14]。ARCH(q)模型由諾貝爾經(jīng)濟(jì)學(xué)獎(jiǎng)獲得者恩格爾提出,它針對(duì)均值方程的殘差波動(dòng)項(xiàng)建立模型并用于預(yù)測(cè),模型表達(dá)式為
均值方程:
Yt=F(t,Yt-1,Yt-2,…)+ut
(9)
式中:F(t,Yt-1,Yt-2…)為時(shí)間序列{Yt}的確定信息擬合模型,本文為所建SARIMA(p,d,q)×(P,D,Q)s模型。
條件方差方程為
(10)
式中:It-1為已知信息集;ω0為常數(shù)項(xiàng)。
(11)
式中:ω為ARCH項(xiàng)參數(shù);θ為GARCH項(xiàng)參數(shù)。
綜上,GARCH模型考慮了異方差效應(yīng)對(duì)時(shí)序模型的影響,能對(duì)因變量的方差進(jìn)行更準(zhǔn)確的預(yù)測(cè),因此可以提高均值方程參數(shù)估計(jì)的有效性,改善時(shí)序模型的預(yù)測(cè)精度。
本文從國(guó)家統(tǒng)計(jì)局官網(wǎng)提取到2005年1月—2019年5月年共173組鐵路月度客運(yùn)量統(tǒng)計(jì)數(shù)據(jù),構(gòu)成時(shí)間序列研究樣本。
由圖1可知,鐵路月度客運(yùn)量序列與時(shí)間呈指數(shù)關(guān)系,非線性、非平穩(wěn)性和趨勢(shì)性顯著,且存在遞增型異方差,直接建模難以取得良好效果。所以,建模前先對(duì)原始序列Y取自然對(duì)數(shù)得LY序列(異方差得到一定程度抑制,見圖2),再對(duì)LY序列進(jìn)行平穩(wěn)化處理和單整性檢驗(yàn)。
圖1 客運(yùn)量原始序列Y的時(shí)序圖
本文采用ADF單位根檢驗(yàn)法來(lái)判定時(shí)間序列的平穩(wěn)性。若不平穩(wěn),則對(duì)LY序列依次進(jìn)行d階差分直至序列平穩(wěn),再進(jìn)行分析建模。對(duì)LY序列的平穩(wěn)性ADF檢驗(yàn)結(jié)果見表1。
圖2 客運(yùn)量對(duì)數(shù)序列LY的時(shí)序圖
表1 LY序列ADF檢驗(yàn)結(jié)果
檢驗(yàn)結(jié)果分析:(1)LY序列的ADF檢驗(yàn)統(tǒng)計(jì)量均大于1%、5%和10%水平的臨界值,且接受存在單位根的原假設(shè)的概率為0.348 8。所以,LY序列是非平穩(wěn)序列。(2)經(jīng)一階差分后的序列ΔLY對(duì)應(yīng)的ADF檢驗(yàn)統(tǒng)計(jì)量為-20.246 6,小于1%的顯著水平臨界值,其接受存在單位根原假設(shè)的概率為0,即不接受原假設(shè),表明ΔLY是平穩(wěn)的。同時(shí),從一階差分序列ΔLY的時(shí)序圖3也可看出,差分序列圍繞0軸上下波動(dòng),呈現(xiàn)出良好的平穩(wěn)性。綜上,LY序列為一階單整序列,記為L(zhǎng)Y~I(xiàn)(1)。
圖3 一階差分序列ΔLY的時(shí)序圖
為了直觀準(zhǔn)確表征趨勢(shì)因素、季節(jié)因素和隨機(jī)因素的存在,本文根據(jù)鐵路月度客運(yùn)量序列具有遞增型異方差特性,采用季節(jié)分解的乘法模型,把{Yt}分解為趨勢(shì)循環(huán)分量Tt、季節(jié)分量St和隨機(jī)分量It:Yt=Tt×St×It。
具體分解步驟有如下3個(gè)階段[15]:
第一階段:初始季節(jié)因素調(diào)整
(12)
該移動(dòng)平均能保留線性趨勢(shì),消除12階不變季節(jié)性,并減少不規(guī)則成分方差。
(13)
從原序列中剔除趨勢(shì)循環(huán)分量后即得到季節(jié)-隨機(jī)成分。
(14)
式中:
(15)
即對(duì)每個(gè)月的觀測(cè)值分別進(jìn)行3×3的季節(jié)移動(dòng)平均,將初步估計(jì)的季節(jié)成分剔除其2×12項(xiàng)簡(jiǎn)單移動(dòng)平均,以消除季節(jié)分量中的殘余趨勢(shì)。
(4)季節(jié)調(diào)整結(jié)果的初始估計(jì)
(16)
第二階段:精確季節(jié)因素調(diào)整
(17)
式中:H為Henderson加權(quán)移動(dòng)平均項(xiàng)數(shù),隨機(jī)分量I越大,需要的項(xiàng)數(shù)越多;h為Henderson加權(quán)移動(dòng)平均系數(shù)。
(18)
(19)
式中:
(20)
(4)季節(jié)調(diào)整結(jié)果的二次估計(jì)
(21)
第三階段:估計(jì)最終的趨勢(shì)循環(huán)分量和隨機(jī)分量
(22)
(23)
最終得到季節(jié)分解乘法模型的各分量序列
(24)
按照式(24)方法提取出月度客運(yùn)量序列中的趨勢(shì)循環(huán)分量、季節(jié)分量和隨機(jī)分量,見圖4~圖6。
圖4 鐵路月度客運(yùn)量趨勢(shì)循環(huán)分量Tt
圖5 鐵路月度客運(yùn)量的季節(jié)分量St
圖6 鐵路月度客運(yùn)量的隨機(jī)分量It
從月度客運(yùn)量序列的成分分解時(shí)序圖可見,客運(yùn)量各分量隨時(shí)間的變化特性差異較大,呈現(xiàn)明顯的趨勢(shì)性、季節(jié)周期性以及隨機(jī)性特征。所以,鐵路月度客運(yùn)量時(shí)間序列適宜采用乘法季節(jié)模型進(jìn)行預(yù)測(cè)。
經(jīng)上述量化檢驗(yàn)和分析可知,對(duì)數(shù)序列LY經(jīng)一階差分后平穩(wěn)。因此,可以對(duì)LY序列進(jìn)行建模。
(1)確定周期s和差分次數(shù)d、D
本文以月度數(shù)據(jù)為研究樣本,即周期s取12。同時(shí),從LY的相關(guān)圖7也可以看出,其自相關(guān)系數(shù)呈線性緩慢衰減,在滯后期為12的整倍數(shù)時(shí)點(diǎn)上出現(xiàn)自相關(guān)系數(shù)絕對(duì)值較大的峰值;這在ΔLY序列的相關(guān)圖8中體現(xiàn)尤其明顯,12的整倍數(shù)時(shí)點(diǎn)出現(xiàn)峰值,且呈振蕩式衰減變化。
圖7 對(duì)數(shù)序列LY的自相關(guān)、偏相關(guān)圖
圖8 一階差分序列ΔLY的自相關(guān)、偏相關(guān)圖
這足以證明序列存在顯著的以12為周期的季節(jié)波動(dòng),這與實(shí)際情況一致。因此,需對(duì)其進(jìn)行季節(jié)性差分(或12階差分)。對(duì)數(shù)序列LY的一階差分ΔLY平穩(wěn),即非季節(jié)差分次數(shù)d取1。對(duì)ΔLY進(jìn)行一次季節(jié)性差分后得到ΔΔ12LY序列,其時(shí)序圖見圖9、相關(guān)圖見圖10。
由圖9可知ΔΔ12LY序列圍繞0軸上下小幅波動(dòng),呈現(xiàn)良好的平穩(wěn)性。同時(shí),圖10也顯示在滯后期12的整倍數(shù)時(shí)點(diǎn)處的相關(guān)系數(shù)在2倍標(biāo)準(zhǔn)差范圍內(nèi),說(shuō)明其季節(jié)性成分已被充分提取。綜上,季節(jié)性差分次數(shù)D取1可滿足平穩(wěn)性要求。
(2)模型階數(shù)判別
觀察圖10,結(jié)合表2的模型階數(shù)判別方法,可以看到自相關(guān)和偏相關(guān)圖都呈欠阻尼狀態(tài)震蕩衰減,非季節(jié)自相關(guān)系數(shù)呈1階或2階截尾,即非季節(jié)項(xiàng)AR的階數(shù)p可取1或2。同時(shí),由于平穩(wěn)序列ΔΔ12LY中大部分季節(jié)性波動(dòng)已被消除,其周期12整倍數(shù)時(shí)點(diǎn)的季節(jié)自相關(guān)系數(shù)在2倍的標(biāo)準(zhǔn)差范圍緩慢衰減,自相關(guān)性明顯減弱,說(shuō)明針對(duì)該序列建立滯后1階和12階上的SARIMA 模型是合適的,即模型的非季節(jié)項(xiàng)MA的階數(shù)q取1,季節(jié)項(xiàng)SMA的階數(shù)Q也取1。季節(jié)項(xiàng)SAR的階數(shù)P可取0(按拖尾衰減處理)或1(按1階截尾處理)。據(jù)此,可初步確定符合要求的四個(gè)SARIMA(p,d,q)(P,D,Q)12模型:(1,1,1)(0,1,1)12、(1,1,1)(1,1,1)12、(2,1,1)(0,1,1)12和(2,1,1)(1,1,1)12。
圖9 ΔΔ12LY的時(shí)序圖
圖10 ΔΔ12LY的自相關(guān)、偏相關(guān)圖
(3)SARIMA模型擬合優(yōu)度檢驗(yàn)及篩選
對(duì)上述4個(gè)備選季節(jié)模型進(jìn)行擬合優(yōu)度檢驗(yàn),見表3。
表2 模型階數(shù)判別表
表3 模型擬合優(yōu)度檢驗(yàn)結(jié)果
表3中的調(diào)整后可決系數(shù)R2表示模型的整體擬合優(yōu)度,取值范圍[0,1],該值越大表示模型擬合效果越好。赤池信息量準(zhǔn)則AIC、施瓦茨信息量準(zhǔn)則SC取值越小表明模型擬合精度越高。DW值表示模型殘差的不相關(guān)程度,范圍在0~4之間,該值越接近2表明自相關(guān)程度越低,建模效果越好。通過(guò)表3的檢驗(yàn)結(jié)果對(duì)比,SARIMA(2,1,1)(1,1,1)12模型的可決系數(shù)R2最大,AIC和SC值最小,DW統(tǒng)計(jì)值最接近2,多項(xiàng)指標(biāo)均顯示其檢驗(yàn)結(jié)果為最優(yōu),因此,最終選定SARIMA(2,1,1)(1,1,1)12模型對(duì)樣本序列建立基礎(chǔ)模型。
(4)SARIMA模型參數(shù)估計(jì)
取2005年1月—2018年12月期間的數(shù)據(jù)作為訓(xùn)練樣本運(yùn)用OLS方法估計(jì)出SARIMA(2,1,1)(1,1,1)12模型方程為
(1+0.420 2L+0.408 6L2)(1-0.323 3L12)ΔΔ12LYt=(1-0.661 0L)(1-0.797 6L12)vt
(25)
t統(tǒng)計(jì)量:(-4.821 3)(-4.498 6) (2.287 7) (-7.957 2) (-6.367 0)
R2為0.675 7,標(biāo)準(zhǔn)差(Standard Error,SE)為0.054 4,殘差平方和(Residual Sum of Squares,RSS)為0.441 7,AIC值為-2.893 1,SC值為-2.775 3
可見,該方程各參數(shù)統(tǒng)計(jì)量均較顯著,初步擬合效果較好。
(1)SARIMA模型殘差的ARCH效應(yīng)檢驗(yàn)
在進(jìn)一步構(gòu)建GARCH(1,1)模型前,需對(duì)基礎(chǔ)模型SARIMA(2,1,1)(1,1,1)12殘差進(jìn)行ARCH檢驗(yàn)。首先,觀察SARIMA(2,1,1)(1,1,1)12模型殘差時(shí)序圖11,發(fā)現(xiàn)殘差波動(dòng)存在“集聚”現(xiàn)象:波動(dòng)在一些時(shí)段內(nèi)較小,在一些時(shí)段內(nèi)又變得很大。據(jù)此初步判斷殘差序列存在ARCH效應(yīng)。
圖11 SARIMA(2,1,1)(1,1,1)12模型殘差時(shí)序圖
為進(jìn)一步證實(shí)模型殘差序列具有ARCH效應(yīng),本文采用White檢驗(yàn)法對(duì)其進(jìn)行ARCH效應(yīng)量化檢驗(yàn)。檢驗(yàn)結(jié)果見表4。
表4 SARIMA(2,1,1)(1,1,1)12模型殘差A(yù)RCH檢驗(yàn)結(jié)果
從表4中可見,F(xiàn)統(tǒng)計(jì)量、LM統(tǒng)計(jì)量均顯著,其接受殘差序列是同方差的原假設(shè)的相伴概率P值都為0,即拒絕原假設(shè),殘差序列存在顯著的異方差。
(2)構(gòu)建SARIMA-GARCH融合模型
在SARIMA(2,1,1)(1,1,1)12的基礎(chǔ)上考慮ARCH效應(yīng)后重新對(duì)序列進(jìn)行極大似然估計(jì),可得SARIMA(2,1,1)(1,1,1)12-GARCH(1,1)融合模型為
均值方程:(1+0.399 1L+0.407 3L2)(1-0.248 0L12)ΔΔ12LYt=(1-0.652 5L)(1-0.898 6L12)vt
(26)
t統(tǒng)計(jì)量: (-4.584 0) (-4.368 3) (3.443 2) (-8.487 1) (-44.309 3)
(27)
t統(tǒng)計(jì)量: (2.068 4) (23.840 2)
R2為0.902 3,SE為0.033 0,RSS為0.381 9,AIC值為-3.994 8,SC值為-3.879 3
與式(25)的SARIMA模型相比,考慮了條件異方差所建立的SARIMA-GARCH融合模型擬合優(yōu)度R2有了較大改善,參數(shù)統(tǒng)計(jì)量更為顯著,標(biāo)準(zhǔn)差、殘差平方和以及AIC、SC值也顯著縮小。均值方程各參數(shù)估計(jì)值有小幅修正,方差方程ARCH項(xiàng)、GARCH項(xiàng)系數(shù)均統(tǒng)計(jì)顯著。ARCH、GARCH項(xiàng)系數(shù)都為正,滿足了參數(shù)約束,系數(shù)之和近似為1,表現(xiàn)出良好的收斂性。這充分說(shuō)明SARIMA-GARCH融合模型能更好地?cái)M合鐵路月度客運(yùn)量數(shù)據(jù)。
得到SARIMA-GARCH模型后,為避免擬合過(guò)程中還有重要信息丟失,需進(jìn)一步檢驗(yàn)?zāi)P偷姆€(wěn)定性,即對(duì)殘差的異方差效應(yīng)和自相關(guān)性進(jìn)行檢驗(yàn)分析,若模型不穩(wěn)定則解釋力有限。
(1)模型殘差的ARCH-LM檢驗(yàn)
采用ARCH-LM方法檢驗(yàn)方程殘差的條件異方差,結(jié)果見表5。
表5 SARIMA-GARCH模型殘差A(yù)RCH檢驗(yàn)結(jié)果
檢驗(yàn)得到F統(tǒng)計(jì)量、LM統(tǒng)計(jì)量均不顯著,相伴概率P值均為0.55,即接受同方差的原假設(shè),說(shuō)明引入GARCH模型后消除了原殘差序列的異方差效應(yīng)。
(2)模型殘差的平方相關(guān)圖檢驗(yàn)
通過(guò)殘差平方相關(guān)圖和Q-統(tǒng)計(jì)量對(duì)模型殘差進(jìn)行檢驗(yàn),見圖12。
圖12 SARIMA-GARCH模型殘差平方相關(guān)圖
由圖12可知,模型殘差的ACF和PACF值均顯著地落在2倍的標(biāo)準(zhǔn)差范圍內(nèi),自相關(guān)和偏自相關(guān)系數(shù)近似為0,殘差序列為同方差的原假設(shè)的相伴概率值均大于10%,可以認(rèn)定殘差序列為白噪聲,即模型已將原時(shí)間序列的信息基本提取完畢。
綜上,所建SARIMA-GARCH穩(wěn)定性良好,對(duì)建模數(shù)據(jù)的解釋力較強(qiáng)。
為驗(yàn)證所建模型的有效性,將SARIMA-GARCH模型與常規(guī)SARIMA、ARIMA和NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)等時(shí)序模型的短期預(yù)測(cè)值進(jìn)行精度對(duì)比,并對(duì)該模型的中長(zhǎng)期預(yù)測(cè)效果進(jìn)行分析。
以2019年1—5月份的客運(yùn)量數(shù)據(jù)作為測(cè)試樣本,將SARIMA(2,1,1)(1,1,1)12-GARCH(1,1)模型與SARIMA(2,1,1)(1,1,1)12、ARIMA(2,1,1)和NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型的短期預(yù)測(cè)值進(jìn)行精度對(duì)比見表6。
對(duì)比表6中4種模型的短期測(cè)算結(jié)果,可以看到所構(gòu)建的SARIMA-GARCH融合模型與SARIMA基礎(chǔ)模型的穩(wěn)定性更好,平均絕對(duì)百分誤差均小于5%,而ARIMA模型和NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型的穩(wěn)定性要差些,平均絕對(duì)百分誤差也大于5%。這表明,前兩類模型在對(duì)具有季節(jié)性變化的時(shí)間序列建模時(shí)更具優(yōu)勢(shì),其建模效果較好。同時(shí),由于SARIMA-GARCH融合模型考慮了時(shí)間序列中存在的異方差效應(yīng),提高了對(duì)波動(dòng)性的刻畫精度,使得預(yù)測(cè)值與實(shí)際值接近程度更高、偏差更小,短期預(yù)測(cè)精度比單純的SARIMA模型更好。因此,所建模型的數(shù)據(jù)擬合能力較強(qiáng),短期測(cè)算精度較高。
表6 2019年1—5月鐵路月度客運(yùn)量預(yù)測(cè)誤差比較
本文選取平均相對(duì)誤差δMPE、Theil不等系數(shù)U、偏差比σBP、方差比σVP和協(xié)方差比σCP等多個(gè)評(píng)價(jià)指標(biāo)對(duì)模型中長(zhǎng)期預(yù)測(cè)性能進(jìn)行驗(yàn)證評(píng)價(jià)。
(1)平均相對(duì)誤差δMPE
(28)
(2)Theil不等系數(shù)U
(29)
(3)偏差比σBP
(30)
(4)方差比σVP
(31)
(5)協(xié)方差比σCP
(32)
以2005年1月為基期,利用所建SARIMA-GARCH模型對(duì)鐵路月度客運(yùn)量進(jìn)行中長(zhǎng)期測(cè)算,測(cè)算值與相應(yīng)月份客運(yùn)量實(shí)際值的對(duì)比效果見圖13。
圖13 SARIMA-GARCH模型中長(zhǎng)期預(yù)測(cè)值與實(shí)際值對(duì)比圖
從圖13可見,建模期內(nèi)(2019年虛線軸左側(cè)區(qū)域)模型的中長(zhǎng)期預(yù)測(cè)值與真實(shí)值的擬合程度也比較好。各項(xiàng)預(yù)測(cè)性能指標(biāo):平均相對(duì)誤差MPE為5.69%,高于短期測(cè)試區(qū)(2019年1月至2019年5月條形區(qū)域)的相對(duì)誤差MPE值2.52%;Theil不等系數(shù)U為0.043 7,它是不受量綱影響的相對(duì)指標(biāo),度量的是相對(duì)均方誤差;偏倚比σBP為0.114 2,它表示的是系統(tǒng)誤差,度量了預(yù)測(cè)值與實(shí)際值序列均值的偏離程度;方差比σVP為0.008 2,該值較小近乎為0,度量了預(yù)測(cè)值方差與實(shí)際值方差的偏離程度;協(xié)方差比σCP為0.877 6,略低于0.9,它衡量了剩余的非系統(tǒng)預(yù)測(cè)誤差及模型的預(yù)測(cè)穩(wěn)定性。若預(yù)測(cè)效果良好,則偏倚比σBP和方差比σVP都會(huì)比較小,而協(xié)方差比σCP會(huì)比較大,且三者之和為1。
比較而言,SARIMA-GARCH模型的中長(zhǎng)期預(yù)測(cè)精度較短期預(yù)測(cè)有所降低,表明該模型更適合作短期預(yù)測(cè)。
本文通過(guò)季節(jié)分解法量化分解出鐵路月度客運(yùn)量時(shí)間序列中的趨勢(shì)循環(huán)分量、季節(jié)分量和不規(guī)則波動(dòng)分量。然后,對(duì)時(shí)間序列平穩(wěn)化、單整性處理后引入SARIMA模型對(duì)其季節(jié)性、趨勢(shì)性進(jìn)行基礎(chǔ)建模。為進(jìn)一步提高對(duì)波動(dòng)性的刻畫精度,消除異方差性,對(duì)基礎(chǔ)模型殘差構(gòu)建了GARCH模型,得到SARIMA-GARCH融合模型。最后,為驗(yàn)證該模型的穩(wěn)定性和實(shí)用性,將其與常規(guī)的SARIMA、ARIMA和NAR動(dòng)態(tài)神經(jīng)網(wǎng)絡(luò)模型短期預(yù)測(cè)值進(jìn)行精度對(duì)比分析,同時(shí)對(duì)其中長(zhǎng)期預(yù)測(cè)效果作了測(cè)試分析。研究結(jié)果表明:
(1)鐵路月度客運(yùn)量具有顯著的趨勢(shì)性、季節(jié)性和波動(dòng)性特征。鐵路客運(yùn)組織部門需在總體滿足旅客出行需求逐漸增長(zhǎng)的前提下,靈活地根據(jù)各月份客運(yùn)量的季節(jié)性波動(dòng)合理制定列車開行計(jì)劃和車底運(yùn)用方案。
(2)鐵路月度客運(yùn)量時(shí)間序列是非平穩(wěn)、非線性及存在異方差效應(yīng)的。在對(duì)其進(jìn)行建模預(yù)測(cè)時(shí),為確保預(yù)測(cè)精度,不能忽視其單整性和異方差性的影響。
(3)綜合考慮了月度客運(yùn)量序列的趨勢(shì)性、季節(jié)性和波動(dòng)性的SARIMA-GARCH模型能很好地?cái)M合數(shù)據(jù),短期預(yù)測(cè)性能良好。
基于SARIMA-GARCH的月度客運(yùn)量預(yù)測(cè)模型豐富了鐵路運(yùn)輸組織的優(yōu)化理論體系,可為鐵路客運(yùn)組織部門制定設(shè)備運(yùn)用方案或日常運(yùn)營(yíng)計(jì)劃提供科學(xué)的決策參考。