摘? 要:交通運(yùn)輸業(yè)的發(fā)展對(duì)國(guó)民經(jīng)濟(jì)具有先導(dǎo)作用,利用過(guò)去的貨物周轉(zhuǎn)量預(yù)測(cè)未來(lái)值,有利于反映物流產(chǎn)業(yè)發(fā)展趨勢(shì)?;趪?guó)家統(tǒng)計(jì)局公開(kāi)的2012年1月至2020年12月共9年中國(guó)貨物周轉(zhuǎn)量月度數(shù)據(jù),分別選用簡(jiǎn)單季節(jié)ARIMA模型和乘積季節(jié)ARIMA模型進(jìn)行擬合,并預(yù)測(cè)2021年1月至12月的貨物周轉(zhuǎn)量數(shù)據(jù)。使用兩種模型進(jìn)行預(yù)測(cè)的平均相對(duì)誤差均較小,并且乘積季節(jié)模型的預(yù)測(cè)能力優(yōu)于簡(jiǎn)單季節(jié)模型。
關(guān)鍵詞:貨物周轉(zhuǎn)量;簡(jiǎn)單季節(jié)模型;乘積季節(jié)模型;ARIMA模型;殘差診斷
中圖分類號(hào):TP391 ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2022)03-0141-05
Short Term Prediction of China's Cargo Turnover Based on Seasonal ARIMA Model
LI Kexin
(South China Normal University, Guangzhou? 510631, China)
Abstract: The development of transportation industry plays a leading role in the national economy. Predicting the future number by using the turnover of freight traffic in the past is beneficial to reflect the development trend of logistics industry. Based on the monthly data of Chinese turnover of freight traffic from January 2012 to December 2020 altogether 9 years published by the National Bureau of Statistics, this paper selects separately simple season ARIMA model and product season ARIMA model for fitting, and predicts the data of turnover of freight traffic from January to December 2021.The average relative errors of the two types of models are all lesser, and the prediction ability of product season model is better than the simple season model.
Keywords: turnover of freight traffic; simple season model; product season model; ARIMA model; residual diagnosis
0? 引? 言
貨物周轉(zhuǎn)量是運(yùn)輸企業(yè)所運(yùn)貨物噸數(shù)與其運(yùn)送距離的乘積,代表了在一定時(shí)期內(nèi)國(guó)民經(jīng)濟(jì)各部門對(duì)貨物運(yùn)輸?shù)男枨笠约吧鐣?huì)貨物運(yùn)輸總量,而貨物運(yùn)輸需求大小取決于社會(huì)經(jīng)濟(jì)的發(fā)展水平。國(guó)內(nèi)學(xué)者張寶友在探究我國(guó)物流業(yè)與進(jìn)出口貿(mào)易關(guān)系時(shí),認(rèn)為兩者之間存在極大的相關(guān)性,并且物流業(yè)對(duì)我國(guó)進(jìn)出口貿(mào)易的發(fā)展起到了推動(dòng)作用[1]。因此預(yù)測(cè)貨物周轉(zhuǎn)量的未來(lái)趨勢(shì),對(duì)促進(jìn)物流業(yè)發(fā)展和國(guó)民經(jīng)濟(jì)發(fā)展具有重要作用。
近年來(lái),國(guó)內(nèi)外有許多學(xué)者運(yùn)用時(shí)間序列方法預(yù)測(cè)交通運(yùn)輸業(yè)的發(fā)展趨勢(shì)。凱里·高(Gogh Carey)和羅布·勞(Law Rob)[2]在對(duì)客源數(shù)據(jù)進(jìn)行建模時(shí),分別使用十個(gè)時(shí)間序列模型進(jìn)行分析,研究成果表明在有干預(yù)的情況下,季節(jié)性ARIMA方法預(yù)測(cè)的準(zhǔn)確度最高。關(guān)于季節(jié)性因素的周期長(zhǎng)度,童明榮等[3]學(xué)者在對(duì)公路運(yùn)輸量建立ARIMA模型時(shí),使用最小二乘法估計(jì)參數(shù)得到趨勢(shì)方程,并利用傅立葉周期分析得出長(zhǎng)度為12的季節(jié)成分,將12個(gè)月作為季節(jié)性的周期。在季節(jié)性時(shí)間序列研究中,大多數(shù)直接采用乘積季節(jié)模型,關(guān)于簡(jiǎn)單季節(jié)模型(即加法季節(jié)模型)的研究卻極少。事實(shí)上,時(shí)間序列中的季節(jié)效應(yīng)、隨機(jī)效應(yīng)和趨勢(shì)效應(yīng)的關(guān)聯(lián)方式各有不同,簡(jiǎn)單季節(jié)模型也同樣適用于帶有趨勢(shì)性和季節(jié)性的時(shí)間序列。高孝偉等[4]學(xué)者在對(duì)季節(jié)指數(shù)進(jìn)行計(jì)算時(shí),認(rèn)為在考慮長(zhǎng)期趨勢(shì)時(shí),利用加法季節(jié)模型比乘積季節(jié)模型更加具有合理性。因此,我們需要根據(jù)時(shí)間序列數(shù)據(jù)的特點(diǎn),并且結(jié)合模型的擬合效果選擇最優(yōu)的模型。
本文選取2012年1月至2020年12月的貨物周轉(zhuǎn)量月度數(shù)據(jù)。由于季節(jié)變動(dòng)和經(jīng)濟(jì)發(fā)展的影響,貨物周轉(zhuǎn)量大多帶有季節(jié)性和趨勢(shì)性,因此選用季節(jié)性ARIMA模型進(jìn)行擬合及預(yù)測(cè)具有一定的優(yōu)勢(shì)。本文對(duì)貨物周轉(zhuǎn)量分別進(jìn)行簡(jiǎn)單季節(jié)ARIMA模型和乘積季節(jié)ARIMA模型擬合,還進(jìn)行了殘差的自相關(guān)檢驗(yàn),以判斷擬合的模型是否有效提取信息。在短期預(yù)測(cè)部分,本文還對(duì)預(yù)測(cè)結(jié)果進(jìn)行相對(duì)誤差的計(jì)算,以此判斷預(yù)測(cè)精度。
1? 研究理論基礎(chǔ)
ARIMA模型(差分自回歸移動(dòng)平均模型)是統(tǒng)計(jì)學(xué)家博克思(Box)和詹金斯(Jenkins)于20世紀(jì)70年代初提出的一種時(shí)間序列方法,在金融、農(nóng)業(yè)、氣象等領(lǐng)域已有較廣泛的應(yīng)用。該模型利用歷史數(shù)據(jù)揭示隨時(shí)間變化的趨勢(shì),因此具有一定的預(yù)測(cè)能力。
1.1? ARIMA模型基本思想
ARIMA(p,d,q)實(shí)際上是ARMA模型(自回歸移動(dòng)平均模型)的一種擴(kuò)展形式[5]。其中,AR為自回歸模型,p為自回歸項(xiàng);MA為移動(dòng)平均模型,q為移動(dòng)平均項(xiàng);d為原始序列轉(zhuǎn)化為平穩(wěn)序列所需做的差分次數(shù)。絕大部分非平穩(wěn)時(shí)間序列數(shù)據(jù)在經(jīng)過(guò)多次差分后均可以轉(zhuǎn)換成平穩(wěn)序列,因此對(duì)差分后平穩(wěn)的時(shí)間序列使用ARMA模型擬合即為ARIMA模型的建模方法。ARIMA(p,d,q)的數(shù)學(xué)表達(dá)為:
?(B)=1-?1B-?2B2-…-?pBp
θ(B)=1-θ1B-θ2B2-…-θqBq
其中B為后移算子,dxt表示為原始序列xt經(jīng)過(guò)d次差分后的序列,εt為t時(shí)刻的隨機(jī)誤差,是服從均值為0,方差為常數(shù)σ2正態(tài)分布的白噪音。?i為待估計(jì)自回歸參數(shù),θj為待估計(jì)移動(dòng)平均參數(shù)。
1.2? 擴(kuò)展的季節(jié)性ARIMA模型
季節(jié)性ARIMA模型分為簡(jiǎn)單季節(jié)模型和乘積季節(jié)模型。簡(jiǎn)單季節(jié)ARIMA模型是指序列中的季節(jié)效應(yīng)、隨機(jī)效應(yīng)和趨勢(shì)效應(yīng)之間是加法關(guān)系。而若序列的各種效應(yīng)間有復(fù)雜的關(guān)聯(lián)性,則加法關(guān)系不能重復(fù)提取其中的信息,應(yīng)該使用乘積模型。記s為季節(jié)性差分算子,因而有:
sxt=(1-Bs)xt=xt-xt-s
簡(jiǎn)單季節(jié)模型(加法季節(jié)模型):通常周期步長(zhǎng)差分即可將序列中的季節(jié)信息提取完整,低階差分即可將趨勢(shì)信息提取完整,提取完季節(jié)信息和趨勢(shì)信息之后的序列是一個(gè)平穩(wěn)序列,可以用ARMA模型擬合[6]。先對(duì)序列進(jìn)行適當(dāng)d階差分消除趨勢(shì)項(xiàng),再進(jìn)行S步差分消除周期項(xiàng),最后使用ARMA模型擬合隨機(jī)性,模型結(jié)構(gòu)為:
乘積季節(jié)模型:短期相關(guān)性用低階ARMA(p,q)模型提取;季節(jié)相關(guān)性用以周期步長(zhǎng)S為單位的ARMA(P,Q)S模型提取[6]。假設(shè)短期相關(guān)和季節(jié)效應(yīng)之間具有乘積關(guān)系,乘積季節(jié)模型ARMA(p,d,q)×(P,D,Q)S結(jié)構(gòu)為:
U(BS)=1-?1BS-?2B2S-…-?pBpS
其中,d為階差分消除趨勢(shì)項(xiàng);S為周期長(zhǎng)度;P為季節(jié)性自回歸階數(shù);D為季節(jié)性差分階數(shù);Q為季節(jié)性移動(dòng)平均階數(shù)。
1.3? 季節(jié)性ARIMA模型建模步驟
使用季節(jié)性ARIMA模型進(jìn)行時(shí)間序列分析的步驟為:(1)繪制時(shí)序圖,初步判斷平穩(wěn)性、趨勢(shì)性和周期性。計(jì)算并繪制自相關(guān)函數(shù)圖和偏自相關(guān)函數(shù)圖,并且用單位根檢驗(yàn)其平穩(wěn)性(Augmented Dickey-Fuller test, ADF)。(2)對(duì)非平穩(wěn)序列進(jìn)行平穩(wěn)化處理。若時(shí)序圖呈現(xiàn)較強(qiáng)的趨勢(shì)性和周期性,需要使用多階差分和多步差分分別消除趨勢(shì)性和周期性。為了確定季節(jié)性的周期,可以直觀觀察時(shí)序圖和自相關(guān)圖,還可以使用傅立葉周期分析確定。(3)根據(jù)時(shí)間序列的自相關(guān)圖和偏自相關(guān)圖確定階數(shù),輔以AIC赤池信息準(zhǔn)則和SBC貝葉斯信息準(zhǔn)則進(jìn)行調(diào)整,AIC或SBC值越小表明模型越好,通過(guò)多個(gè)模型的比較進(jìn)而建立效果最好的模型。(4)對(duì)擬合的模型進(jìn)行參數(shù)估計(jì),判斷變量是否通過(guò)顯著性檢驗(yàn),若不通過(guò)則需要將變量剔除,適用剩下的變量重新擬合。(5)對(duì)擬合模型的殘差進(jìn)行假設(shè)檢驗(yàn),診斷殘差是否為白噪聲,即是否仍存在自相關(guān)和是否符合正態(tài)性。如果殘差序列為非白噪聲序列,則模型并沒(méi)有完整提取序列中的相關(guān)信息,即殘差中還殘留部分相關(guān)信息,說(shuō)明模型擬合得不夠好。(6)使用通過(guò)了上述檢驗(yàn)的模型進(jìn)行未來(lái)數(shù)據(jù)的預(yù)測(cè)分析。繪制預(yù)測(cè)數(shù)據(jù)95%置信區(qū)間圖像,并計(jì)算預(yù)測(cè)數(shù)據(jù)對(duì)真實(shí)值數(shù)據(jù)的偏離程度,判斷預(yù)測(cè)效果的優(yōu)劣。建模流程圖如圖1所示。
2? 實(shí)驗(yàn)與分析
對(duì)貨物周轉(zhuǎn)量的準(zhǔn)確預(yù)測(cè),是正確分析貨運(yùn)供求關(guān)系,明確發(fā)展方向的關(guān)鍵。本文選取國(guó)家統(tǒng)計(jì)局網(wǎng)站[7]公開(kāi)的2012年1月至2020年12月一共108個(gè)月度全國(guó)貨物周轉(zhuǎn)量數(shù)據(jù)進(jìn)行分析。此外,對(duì)于某些年份12月官方數(shù)據(jù)缺失,本文使用全年累計(jì)值減去前11個(gè)月累計(jì)值得出12月當(dāng)期值,數(shù)據(jù)偏差在可接受范圍內(nèi)。本文在此數(shù)據(jù)基礎(chǔ)上運(yùn)用SAS統(tǒng)計(jì)軟件建立模型及預(yù)測(cè)。
2.1? 序列觀察
為直觀觀察時(shí)間序列的變化,制作出時(shí)序圖,如圖2所示。
從繪制的時(shí)序圖直觀判斷,中國(guó)貨物周轉(zhuǎn)量數(shù)據(jù)在前五年的趨勢(shì)性不明顯,從第六年開(kāi)始隨時(shí)間增加呈現(xiàn)遞增趨勢(shì),并且波動(dòng)性也逐漸增大。此外,該序列有明顯季節(jié)性,大致以12個(gè)月為周期。因此初步判斷該序列為同時(shí)帶有趨勢(shì)性、季節(jié)性和隨機(jī)性的非平穩(wěn)時(shí)間序列,因此選用季節(jié)性ARIMA模型是適合的。
2.2? 模型建立和檢驗(yàn)
對(duì)原始數(shù)據(jù)進(jìn)行一階差分和十二步差分后,滯后6階直至36階均通過(guò)了ADF平穩(wěn)性檢驗(yàn),并且在0.05顯著性水平下拒絕白噪聲假設(shè),表明仍有部分信息未被提取出來(lái),因此需要后續(xù)進(jìn)行擬合,有繼續(xù)分析的價(jià)值。差分后的序列為平穩(wěn)非白噪聲序列,滿足使用ARMA模型進(jìn)行擬合的條件。
計(jì)算ACF(自相關(guān))值和PACF(偏自相關(guān))值,并根據(jù)繪制的自相關(guān)圖和偏自相關(guān)圖的拖尾截尾性定階,在0.05的顯著性水平下剔除了不顯著的參數(shù),輔以AIC和SBC準(zhǔn)則,選擇最佳的簡(jiǎn)單季節(jié)模型和乘積季節(jié)模型分別為:
(1-B)(1-B12) xt = (1-0.560 79B)(1-0.450 44B12) εt
模型對(duì)應(yīng)的AIC和SBC值如表1所示。
基于表1的結(jié)果,簡(jiǎn)單季節(jié)模型的AIC值和SBC值均大于乘積季節(jié)模型。根據(jù)AIC和SBC準(zhǔn)則,在所有通過(guò)檢驗(yàn)的模型中,使得AIC和SBC函數(shù)值達(dá)到最小的模型為相對(duì)最優(yōu)模型。因此認(rèn)為,在本文選取的中國(guó)貨物周轉(zhuǎn)量時(shí)間序列數(shù)據(jù)中,使用乘積季節(jié)ARIMA模型的擬合效果較好。
殘差分析可以從兩部分進(jìn)行,一是判斷殘差是否仍存在自相關(guān)性,二是判斷殘差是否符合正態(tài)性假設(shè)。由表2可知,簡(jiǎn)單季節(jié)模型和乘積季節(jié)模型殘差自相關(guān)檢驗(yàn)的p值(Pr>卡方)均大于0.05,不能拒絕殘差無(wú)自相關(guān)性的原假設(shè),即表明殘差無(wú)自相關(guān)性。殘差正態(tài)性可由正態(tài)性檢驗(yàn)的Q-Q圖判斷,殘差大致分布在45°直線上,則可以認(rèn)為殘差基本符合正態(tài)性。若通過(guò)了正態(tài)性和自相關(guān)性檢驗(yàn)則表明模型的殘差中已無(wú)有效信息可以提取。在本文數(shù)據(jù)中,兩種模型的殘差均通過(guò)檢驗(yàn),擬合效果較好。
3? 模型預(yù)測(cè)
為了驗(yàn)證模型的短期預(yù)測(cè)能力,將擬合后的模型分別對(duì)2021年1月至12月的數(shù)據(jù)進(jìn)行預(yù)測(cè)并作圖。從圖3(a)和3(b)中可以看出,簡(jiǎn)單季節(jié)ARIMA模型和乘積季節(jié)ARIMA模型預(yù)測(cè)值大致與真實(shí)值重合,并且波動(dòng)性趨勢(shì)也大致相同,說(shuō)明兩個(gè)模型較好地提取出了原始時(shí)間序列的趨勢(shì)性、季節(jié)性和隨機(jī)性,預(yù)測(cè)的效果較好。從預(yù)測(cè)圖上無(wú)法直觀判斷兩種模型的優(yōu)劣,接下來(lái)對(duì)兩種模型分別計(jì)算預(yù)測(cè)相對(duì)誤差。
將真實(shí)值與預(yù)測(cè)值進(jìn)行對(duì)比和簡(jiǎn)單計(jì)算得出表3所示數(shù)據(jù),第一季度的預(yù)測(cè)效果相對(duì)來(lái)說(shuō)較差,但6月之后的相對(duì)誤差均在5%以內(nèi),總體預(yù)測(cè)能力可以接受。簡(jiǎn)單季節(jié)模型的平均預(yù)測(cè)相對(duì)誤差為7.3%,而乘積季節(jié)模型的平均預(yù)測(cè)相對(duì)誤差為5.9%。從經(jīng)濟(jì)意義上看,小于10%的預(yù)測(cè)誤差都是可以接受的。因此這兩個(gè)模型的預(yù)測(cè)效果都較好,而乘積季節(jié)模型在模型擬合效果和預(yù)測(cè)準(zhǔn)確度上都比簡(jiǎn)單季節(jié)模型要好。
4? 結(jié)? 論
本文結(jié)論有以下兩點(diǎn):
(1)模型結(jié)論。在經(jīng)濟(jì)領(lǐng)域,ARIMA模型已取得良好的應(yīng)用。本文嘗試使用簡(jiǎn)單季節(jié)ARIMA模型和乘積季節(jié)ARIMA模型進(jìn)行貨物周轉(zhuǎn)量的短期預(yù)測(cè),結(jié)果顯示兩種模型均具有較好的實(shí)用價(jià)值。一般認(rèn)為當(dāng)時(shí)間序列數(shù)據(jù)的季節(jié)變動(dòng)大致相等時(shí),或數(shù)據(jù)隨時(shí)間推移等寬變化時(shí),使用簡(jiǎn)單季節(jié)模型即可,優(yōu)點(diǎn)是模型表達(dá)和計(jì)算較簡(jiǎn)潔。反之,當(dāng)季節(jié)變動(dòng)與長(zhǎng)期趨勢(shì)大致成正比或同向變化時(shí),應(yīng)該采用乘積模型。本文選取的原始數(shù)據(jù)的季節(jié)變動(dòng)相對(duì)一致,并且受趨勢(shì)的影響較小,因此使用簡(jiǎn)單季節(jié)模型是可行的。綜合上述實(shí)證分析,與乘積季節(jié)模型相比,簡(jiǎn)單季節(jié)模型雖然預(yù)測(cè)效果稍弱,但也有較好的應(yīng)用價(jià)值,在實(shí)際中可以根據(jù)數(shù)據(jù)的特點(diǎn)和模型的復(fù)雜程度選擇最適合的模型。此外,相比于單一模型,使用組合預(yù)測(cè)方法的預(yù)測(cè)精度更高。因此,為追求更高的預(yù)測(cè)精度,在模型的選擇上面可以使用多種預(yù)測(cè)模型結(jié)合的方式,比如結(jié)合神經(jīng)網(wǎng)絡(luò)或者灰色預(yù)測(cè)。
(2)預(yù)測(cè)結(jié)果。從預(yù)測(cè)的數(shù)據(jù)來(lái)看,中國(guó)貨物周轉(zhuǎn)量的月度數(shù)據(jù)大致呈現(xiàn)趨勢(shì)性和季節(jié)性。趨勢(shì)性表現(xiàn)在從2017年開(kāi)始的貨物周轉(zhuǎn)量具有遞增的趨勢(shì),表明我國(guó)的物流產(chǎn)業(yè)有持續(xù)健康發(fā)展的趨勢(shì),進(jìn)而表明國(guó)民經(jīng)濟(jì)在日益快速發(fā)展。季節(jié)性表現(xiàn)在每年的貨物周轉(zhuǎn)量具有相同的周期性,數(shù)值大致在每年的2月最低,11月最高,這與我國(guó)的國(guó)民消費(fèi)習(xí)慣有關(guān)。2月為舉國(guó)歡慶的春節(jié)假期,許多商家企業(yè)停工放假,因此貨物周轉(zhuǎn)量也相應(yīng)減少。由于近年來(lái)的網(wǎng)購(gòu)潮,11月各大商家對(duì)商品進(jìn)行“雙十一”的促銷活動(dòng),巨大的優(yōu)惠力度刺激著國(guó)民消費(fèi),進(jìn)而刺激貨物的周轉(zhuǎn)量劇增。
從短期來(lái)看,國(guó)民經(jīng)濟(jì)部門和物流產(chǎn)業(yè)可以利用簡(jiǎn)單季節(jié)ARIMA模型和乘積季節(jié)ARIMA模型對(duì)未來(lái)的貨物周轉(zhuǎn)量月度數(shù)據(jù)進(jìn)行預(yù)測(cè),以提前了解未來(lái)物流的發(fā)展趨勢(shì),據(jù)此可以制定相應(yīng)的政策和經(jīng)營(yíng)策略,以促進(jìn)經(jīng)濟(jì)的持續(xù)健康發(fā)展。
參考文獻(xiàn):
[1] 張寶友.現(xiàn)代物流業(yè)對(duì)進(jìn)出口貿(mào)易的影響——基于我國(guó)1995-2004年數(shù)據(jù)的實(shí)證研究 [J].國(guó)際貿(mào)易問(wèn)題,2009,(1):39-46.
[2] GOH C,LAW R. Modeling and forecasting tourism demand for arrivals with stochastic nonstationary seasonality and intervention [J].Tourism Management,2002,23(5):499-510.
[3] 童明榮,薛恒新,林琳.基于季節(jié)ARIMA模型的公路交通量預(yù)測(cè) [J].公路交通科技,2008(1):124-128.
[4] 高孝偉,許濤,鄭林昌,等.對(duì)季節(jié)指數(shù)計(jì)算方法的思考 [J].統(tǒng)計(jì)與決策,2006(9):155.
[5] 熊志斌.基于ARIMA與神經(jīng)網(wǎng)絡(luò)集成的GDP時(shí)間序列預(yù)測(cè)研究 [J].數(shù)理統(tǒng)計(jì)與管理,2011,30(2):306-314.
[6] 王燕.應(yīng)用時(shí)間序列分析 [M].北京:中國(guó)人民大學(xué)出版社,2005.
[7] 國(guó)家統(tǒng)計(jì)局.國(guó)家數(shù)據(jù) [EB/OL].[2021-12-03].https://data.stats.gov.cn/easyquery.htm?cn=A01.
作者簡(jiǎn)介:黎可馨(2000—),女,漢族,廣東梅州人,本科在讀,研究方向:應(yīng)用統(tǒng)計(jì)學(xué)。