汪志紅
(廣東金融學院 金融數學與統(tǒng)計學院,廣州 510521)
鐵路等公共交通是人民生活出行的大眾交通工具,基于大眾假日集中出行特點,我國鐵路旅客客運量具有較強的季節(jié)性特征。同時,鐵路系統(tǒng)完善過程中的交通政策、公共衛(wèi)生和自然災害等突發(fā)事件均會對旅客客運量產生階段性干預影響,對鐵路客運量的季節(jié)性干預特征和影響程度進行分析有助于了解分析我國鐵路旅客季節(jié)和干預流動特點,制定相應的旅客引流政策和措施。
對鐵路等公共交通旅客客運量的季節(jié)性和干預性分析中,學者們通常將季節(jié)性和干預性作為客運量時間序列因素的兩個方面,在基于客運量預測的基礎上對季節(jié)性進行過程性關注研究[1-5],如文獻[1]在構建SARIMA-GARCH鐵路客運量預測模型過程中對其季節(jié)性進行分析,其分析過程多是將客運量序列進行因素分解,運用分解的季節(jié)因素和不規(guī)則因素進行季節(jié)和干預分析,對季節(jié)性調整過程中出現的離群值多未進行焦點式識別,只是進行簡單的變量式處理分析,離群值對季節(jié)性影響鮮有人關注。本質上說,在季節(jié)性調整分析中,根據不同的季節(jié)調整模型,客運量通常會受到較多離群值影響,離群值作為確定鐵路客運量主要干預因素的重要信息來源,對季節(jié)性特征和影響程度都有較大影響,其影響過程不可忽視。為提高干預事件的針對性,早期學者們將真實值和根據序列構建的ARIMA模型擬合值之差作為純干預序列,根據最小二乘等方法估計構建純干預效果模型,將ARIMA模型和干預效果模型合并構成時間序列的ARIMA干預模型,提高了干預事件的識別能力[6-8],方法上存在多重干預因素無法區(qū)分且干預分析系統(tǒng)性不足問題。當前較為廣泛應用的干預分析是在識別相應時間序列離群值和最優(yōu)ARIMA模型基礎上,基于脈沖或階梯函數設定離群值顯示的干預因素虛擬變量,結合干預傳遞函數構建時間序列的干預模型[9-11]。該類方法將干預因素作為時間序列的外在虛擬變量進行基于模型系統(tǒng)的時間序列干預分析,系統(tǒng)性比較強,該過程中,非線性干預傳遞函數階數參數是確定非線性干預過程特征和程度的主要影響因素,階數參數大小差異會引致干預過程差異較大,常規(guī)的干預圖形列舉法會遺漏一些函數階數參數的最佳匹配方案,影響干預特征的判斷和決策。同時,基于外部環(huán)境的干預過程對外部環(huán)境旅客客運量的季節(jié)性因素變量產生較大的系統(tǒng)影響,嚴重程度會引起外部環(huán)境季節(jié)性因素變量分析失真,這方面的問題當前鮮有人關注。
筆者所用的鐵路旅客客運量數據來源于國家統(tǒng)計局(http://www.stats.gov.cn/)數據庫中2011年3月—2021年8月數據,數據中有多個年份的12月出現數據缺失,在保證曲線盡可能光滑的條件下,采用拉格朗日樣條插值法對數據進行插值,完善后的數據特征顯示(見圖1),我國鐵路客運量在2020年新冠疫情前存在逐年上升的趨勢,體現人們對鐵路公共交通的需求旺盛。鐵路客運量在2020年2—4月份受到新冠疫情沖擊,曲線出現急劇非線性“V”型變化特征,新冠疫情對我國鐵路客運量存在短期突發(fā)激冷沖擊。
圖1 我國鐵路旅客客運量時序
根據以上我國鐵路旅客客運量數據特征,在考慮季節(jié)性、周期性、發(fā)展趨勢和異常值影響等因素條件下,應用當前廣泛采用的時間序列季節(jié)調整分析X-13ARIMA-SEATS模型對其進行季節(jié)調整和最優(yōu)季節(jié)性ARIMA模型識別[12-13]。文中主要應用X-13ARIMA-SEATS模型工具對鐵路旅客客運量的最優(yōu)季節(jié)性ARIMA模型和離群值進行自動識別,在自動識別的離群值基礎上進行干預因素設計,構建X-13ARIMA-SEATS模型和ARIMAX模型融合的季節(jié)性線性與非線性干預模型。為體現干預因素對鐵路旅客客運量季節(jié)性變量的系統(tǒng)影響,分為離群值識別和離群值不識別兩種情況進行分析,得到的最優(yōu)季節(jié)調整模型如表1所示。無離群值與有離群值兩類模型的11個M統(tǒng)計量的綜合Q統(tǒng)計量分別為0.81和0.58,均在0~1之間,模型通過檢驗,無離群值與有離群值兩類模型的極大似然估計值分別為-309.48和-182.97,AIC的統(tǒng)計量分別為624.96和391.93,有離群值模型在模型統(tǒng)計量方面略優(yōu)于不帶離群值點模型。
根據表1,鐵路旅客客運量在兩種情況下表現出顯著的序列季節(jié)性特征(sar1,sar2),季節(jié)性變量類型沒有變化,離群值的干預對季節(jié)性趨勢的影響主要表現為季節(jié)性變量影響方向發(fā)生變化,序列季節(jié)性變量由無離群值的正向影響變?yōu)閹щx群值的負向影響,顯示離群值中包含鐵路旅客客運量的自身波動信息,離群值對序列解釋信息的增加進一步清洗序列自身季節(jié)性趨勢的影響信息,基于離群
表1 鐵路旅客客運量X-13ARIMA-SEATS季節(jié)調整結果
值特點的外部干預因素設計有助于厘清鐵路客運量的季節(jié)性類型和特征。無離群值模型對非季節(jié)性趨勢(ar1,ar2)顯示為影響不顯著,在離群值模型中(ar3)表現為顯著。表1顯示鐵路旅客客運量受到較多離群值的干預影響,比較凸顯的是2014年鐵路實名制政策(14.Dec)干預和2020年以來新冠疫情對鐵路旅客客運量的不定期多次干預,其中最強的一次干預在2020年2—4月份(20.Feb),客運量在該時間段均呈現非線性“V”型特征,根據離群值特點有針對性設計外部干預事件變量可以提高焦點干預事件研究的精準度,避免多離群值研究的黑盒性。進一步的旅客客運量季節(jié)因子變化顯示,季節(jié)性波動特征主要體現在7—8月份旅客客運量的大幅增加,在11—12月份旅客客運量達到最低淡季,1—3月份旅客客運量有一定幅度的上升,體現一定的移動假日春節(jié)效應。模型現象顯示依據離群值剝離的外部干預因素在一定程度上能凈化旅客客運量的季節(jié)性外部影響因素,還原旅客客運量的季節(jié)性本質。
基于以上季節(jié)性、春節(jié)效應、政策干預和疫情干預等特征,針對季節(jié)性和焦點干預事件設計鐵路旅客客運量外部春節(jié)效應變量、新冠疫情干預變量和鐵路實名制的政策干預變量,在縮減模型變量同時從模型系統(tǒng)角度分析干預因素對鐵路旅客客運量的季節(jié)性影響。
結合旅客客運量分布圖和季節(jié)調整結果,鐵路存在顯著季節(jié)效應,結合季節(jié)特征,暑運和春節(jié)都具有季節(jié)性特征,兩者區(qū)別在于我國暑運一般固定在7月1日—8月31日,在季節(jié)性特征中就能體現,不需要設定暑運季節(jié)性變量;春節(jié)是陰歷計時,每年根據所處的月份不同產生的影響不同,是移動假日效應,需要針對移動假日設計春節(jié)效應變量;新冠疫情的干預呈現非線性大“V”型特征,具有非線性特征,使用非線性函數分析其對旅客客運量的干預沖擊程度影響;在我國鐵路交通政策系統(tǒng)不斷完善過程中出現政策的干預效應,這些政策通過離群值點得以凸顯,一般體現干預線性特征,需要設計線性干預因素。
加拿大通過礦業(yè)可持續(xù)發(fā)展計劃和“綠色礦業(yè)”行動,將礦產廢棄物循環(huán)利用,在減少礦業(yè)污染、保持生態(tài)平衡、改善居民生活條件等方面具有重大效應。加拿大還極為重視清潔環(huán)保技術的研發(fā)推廣及環(huán)境基礎設施建設,僅最近四年就投入200余億元用于環(huán)保技術和設施的升級改造,并計劃在2020年前投資額翻倍[12]。
與鐵路實名制政策的線性干預特點不同,新冠干預沖擊主要發(fā)生在2020年2—4月,且沖擊過程為非線性的“V”型過程,其脈沖時間較長,運用脈沖函數設計新冠疫情虛擬變量時間T為2020年2—4月,根據新冠疫情虛擬變量與旅客客運量的互相關系數(見圖2)。 新冠疫情因素與旅客客運量存在當期(即0期)的負干預影響,相關性影響程度的置信區(qū)間顯示,其影響的最大延遲階數約為2階。采用時間序列的非線性轉移變換函數ARMA(p,q)設計新冠疫情非線性沖擊干預過程,在該過程設計中,p,q階數對干預過程和程度有較大影響,單一的干預序列階數確定影響干預因素系統(tǒng)性,直觀圖法確定一定程度會遺漏最佳模型。文中在最大延遲2階階數的基礎上使用組合循環(huán)遍歷方法,并結合變量顯著性特點確定最佳轉移變換函數的p,q階數和干預季節(jié)模型,該過程既能解決模型系統(tǒng)性和遺漏問題,也能提高模型的實際應用效果。
圖2 新冠疫情虛擬變量與鐵路旅客客運量互相關系數
基于帶控制變量的干預時間序列模型對干預分析的高系統(tǒng)性優(yōu)點,同時借鑒學者們[16-18]的干預分析過程,選擇帶干預和季節(jié)因素等控制變量的時間序列ARIMAX模型對我國鐵路旅客客運量季節(jié)性和干預性進行系統(tǒng)分析。ARIMAX模型是一種可以對輸入變量進行轉移函數變換的ARIMA模型,是國際較為通用、高系統(tǒng)性的干預分析模型。文中將在設計的虛擬變量和變換轉移函數基礎上,建立基于新冠疫情、政策和移動假日等干預因素影響的ARIMAX模型,其模型基本形式如式(1)所示。
(1)
基于以上變量與模型設計原理,通過兩步法實現以上模型的執(zhí)行過程,第一步,考慮移動假日春節(jié)、鐵路系統(tǒng)政策和新冠疫情線性干預條件下,使用X-13ARIMA-SEATS算法自動識別旅客客運量序列,即εt的最優(yōu)季節(jié)調整具體ARIMA模型,該模型體現旅客序列自身或外在季節(jié)環(huán)境對旅客客運量的影響;第二步,將確定的ARIMA模型與新冠疫情非線性干預變量結合,對新冠疫情非線性轉移變換函數的階數p,q進行一一成對組合,組合循環(huán)遍歷ARIMAX(p,d,q)×(P,D,Q)S干預模型,在AIC最小準則、極大似然估計最大準則以及變量影響顯著的條件下,針對性系統(tǒng)確定最優(yōu)的干預ARIMAX(p,d,q)×(P,D,Q)S模型,該算法相對于表1中X-13ARIMA-SEATS季節(jié)調整基礎模型,既能體現鐵路運輸政策影響程度大小,也能通過轉移變換函數模式顯示非線性新冠疫情沖擊的影響變化過程。
根據以上模型的設計過程與表1的線性干預的季節(jié)調整結果,使用模型設計的第二步,采用ARIMAX(p,d,q)×(P,D,Q)s的非線性干預進行組合循環(huán)遍歷,依據AIC最小、極大似然估計最大和單個變量顯著性的特點,組合循環(huán)遍歷確定的鐵路最佳非線性轉移函數ARMA(p,q)的p,q值分別為(1,1),同時確定的最終季節(jié)性線性和非線性干預模型分析結果如表2所示。線性模型的11個M統(tǒng)計量的Q統(tǒng)計量均在0~1之間,綜合統(tǒng)計量為0.6,在0~1之間,模型通過檢驗,非線性模型殘差序列相關系數均在2倍標準差(0.316 2)范圍內,體現平穩(wěn)性特征,各自由度的Ljung-Box純隨機性統(tǒng)計量均在0.05的顯著性水平條件下表現為純隨機性特征,模型檢驗通過。根據體現模型精度的極大似然估計值與AIC統(tǒng)計量,鐵路旅客客運量的季節(jié)性干預非線性模型的極大似然估計值為-274.79,大于線性模型極大似然值(-281.079 5),非線性AIC統(tǒng)計量為563.57,小于線性模型相應的AIC統(tǒng)計量(574.159 0),非線性模型表現出更高的精度和準確度,展現更佳的可視化干預過程。
表2 鐵路旅客客運量干預模型ARIMAX(1,0,0)×(0,1,1)12分析結果
根據表2,在移動節(jié)日春節(jié)效應、鐵路系統(tǒng)政策和新冠疫情干預的條件下,鐵路旅客客運量季節(jié)性變量影響表現出顯著的外部環(huán)境影響的季節(jié)性移動平均(lsma1,nsma1)特征,與前期離群值序列季節(jié)性自回歸(見表1)結論差異顯著,原因在于離群值模型中離群值剝離對春節(jié)因素的焦點關注不夠,弱化了春節(jié)的移動假日效應對旅客客運量自身的影響,春節(jié)作為移動假日效應,不是旅客客運量季節(jié)性移動的平均因素部分,春節(jié)移動假日(lspring,nspring)在表2中的線性與非線性模型都表現出強顯著的穩(wěn)定影響,顯示春節(jié)作為一種移動的假日效應極大地清洗了鐵路旅客客運量的序列季節(jié)性移動平均效應,展示出我國鐵路真實季節(jié)效應是外部環(huán)境影響的季節(jié)移動平均效應。根據旅客客運量外部環(huán)境季節(jié)移動平均特點,季節(jié)性線性與非線性模型的季節(jié)移動平均影響方向相反,體現季節(jié)性非線性干預模型中非線性因素比線性因素能夠解釋更多的外部干預信息,對季節(jié)移動平均的外部影響因素清洗更徹底,非線性新冠疫情干預因素(nc-ar1,nc-ma0和nc-ma1)在一定程度上會弱化季節(jié)移動平均外部環(huán)境對旅客客運量的趨勢影響,顯示最終的鐵路旅客客運量的季節(jié)性為移動平均外部環(huán)境影響的負向影響,即剝離春節(jié)移動假日影響并提升外部干預因素的非線性解釋信息能力后,鐵路客運量的淡季負向影響要高于旺季的正向影響。移動假日和外部干預因素對我國鐵路旅客客運量的季節(jié)移動平均特征分析有干預性影響,一定程度會引起季節(jié)性移動平均影響分析失真。序列自身的自回歸變量(lar1和nar1)表現穩(wěn)定,不易受干預因素影響。
在外部因素干預影響程度方面,根據非線性干預模型 ARIMAX(1,0,0)×(0,1,1)12,與疫情前(2020年2月)旅客客運量序列均值相比,鐵路旅客客運量在春節(jié)期間旅客客運量(nspring)平均提高了25.23%,展示出較強的旅客客運量提升效應,低于2019年艾媒咨詢(iiMedia Research)發(fā)布的環(huán)比提升35.4%左右的結果,均值與年份點兩類數據的可比性不強,可大致發(fā)現外部環(huán)境因素會提高春節(jié)效應強度,單一春節(jié)效應分析更能真實、準確體現春節(jié)效應程度。與干預前的旅客客運量均值相比,新冠疫情對鐵路旅客客運量的平均干預效應為-12.352/均值(旅客客運量|t<2020.02)=-56.29%,表現出對旅客客運量的強沖擊性,與2020年2月鐵道部門發(fā)布的鐵路旅客客運量下降約6成結論基本一致。在不考慮新鐵路線路開通等外在硬件條件下,鐵路系統(tǒng)旅客實名制政策使鐵路旅客客運量統(tǒng)計數量增加了5.162/均值(旅客客運量|t<2014.12)=31.54%,體現鐵路實名制政策能更全面定位旅客數量,有利于相關政府部門制定更有效的鐵路客運量相關公共政策。
基于時間序列X-13-ARIMA季節(jié)調整模型離群值自動識別功能,確定我國鐵路旅客客運量的各類干預因素,采用互相關函數、組合循環(huán)遍歷工具與ARIMAX干預模型針對性設計鐵路旅客客運量的季節(jié)性干預模型,對我國鐵路旅客客運量的季節(jié)性和干預特征進行比較分析,其研究結論主要包括以下幾點。
1)季節(jié)性非線性干預模型更適合從多因素系統(tǒng)角度分析鐵路旅客客運量的季節(jié)性和干預特征。采用X-13ARIMA-SEATS季節(jié)調整模型自動檢測的離群值特點和對應的季節(jié)性模型,分析得出我國鐵路旅客客運量的主要干預因素和季節(jié)因素。在此基礎上,有針對性地設計鐵路旅客客運量的季節(jié)性因素、移動假日春節(jié)因素以及線性政策和非線性新冠疫情沖擊變量,采用互相關系數和組合循環(huán)遍歷方法設計鐵路旅客客運量的季節(jié)性干預模型,多因素系統(tǒng)分析鐵路旅客客運量的季節(jié)性和干預特征。分析顯示,季節(jié)性非線性干預模型AIC值更小、極大似然估計統(tǒng)計量更大,整體精度高于季節(jié)性線性干預模型。
2)離群值剝離的外部干預因素有助于從本質上還原旅客客運量季節(jié)性影響。通過對模型離群值特點以及離群值設置的外在干預因素季節(jié)性特征分析顯示,外在干預的離群值會對鐵路旅客客運量的季節(jié)性產生較大影響,隨著外部干預因素設置的變化,鐵路旅客客運量都體現出序列自身季節(jié)性和外部環(huán)境干擾季節(jié)性特征之間變換的不穩(wěn)定季節(jié)性特征。依據離群值剝離的外部干預因素在一定程度上能凈化旅客客運量的季節(jié)性因素,還原旅客客運量季節(jié)性本質。
3)季節(jié)性非線性干預模型中非線性因素對外部干預信息解釋能力更強。季節(jié)性的干預模型的干預效應分析顯示,相對線性季節(jié)性干預模型,非線性季節(jié)性干預模型的誤差更小,精度更高。具體分析中,線性和非線性季節(jié)性干預模型對旅客客運量季節(jié)性影響的顯著性影響有一些差異,表鐵路客運量季節(jié)性特征表現為正向影響到負向影響的顯著逆向差異,一定程度上顯示季節(jié)性非線性干預模型中非線性因素要比線性因素更能夠解釋更多的外部干預信息,對季節(jié)性影響因素清洗的更徹底。