馮慧嬌
【摘 要】 本文首先對(duì)時(shí)間序列主要特征和時(shí)間序列分析步驟進(jìn)行介紹,然后在平穩(wěn)時(shí)間序列建模的基礎(chǔ)上對(duì)非平穩(wěn)時(shí)間序列的建模進(jìn)行了分析。在分析的過(guò)程中將非平穩(wěn)時(shí)間序列的建模分為基于確定性分析的建模和基于隨機(jī)性分析的建模兩大類(lèi),并對(duì)此進(jìn)行了比較。最后本文運(yùn)用 2013年 1月至 2017年 12月我國(guó)的民航客運(yùn)量數(shù)據(jù),基于 R 軟件進(jìn)行分析,通過(guò) ARIMA 模型、季節(jié)效應(yīng)分析和 Holt-Winters 模型分別對(duì)我國(guó)的民航客運(yùn)量數(shù)據(jù)進(jìn)行擬合。最后經(jīng)過(guò)模型比較選擇了Holt-Winters模型,并預(yù)測(cè)了我國(guó)2018年12個(gè)月的民航客運(yùn)量。
【關(guān)鍵詞】 時(shí)間序列 民航客運(yùn)量 季節(jié)效應(yīng)分析
ARIMA模型 R軟件
第1章 緒 論
我國(guó)航空運(yùn)輸需求量增長(zhǎng)的主要因素首先是經(jīng)濟(jì)總量擴(kuò)張;其次對(duì)航空運(yùn)輸影響最大的是結(jié)構(gòu)因素;再次,國(guó)際貿(mào)易也是航空運(yùn)輸需求的重要帶動(dòng)因素。我國(guó)全球進(jìn)出口貿(mào)易總額不斷增加,且城鎮(zhèn)居民消費(fèi)有溫飽型轉(zhuǎn)向享受型發(fā)展型,都對(duì)我國(guó)旅游支出、民航發(fā)展提供了極具前景的良好的發(fā)展空間。所以在這種情況下,對(duì)我國(guó)民航客運(yùn)量進(jìn)行分析預(yù)測(cè),對(duì)于民航業(yè)的發(fā)展具有重要的意義。
第2章 時(shí)間序列分析基本方法
2.1平穩(wěn)性檢驗(yàn)
時(shí)間序列法的核心是對(duì)數(shù)據(jù)進(jìn)行平穩(wěn)性檢驗(yàn)。一般有兩種方法來(lái)檢驗(yàn)序列的平穩(wěn)性。其中一種是比較直觀的圖檢驗(yàn)法,由時(shí)序圖和自相關(guān)圖的特征做出判斷,另外一種是具有理論依據(jù)的假設(shè)檢驗(yàn)的方法,手段是構(gòu)造合適的檢驗(yàn)統(tǒng)計(jì)量。
2.2非平穩(wěn)時(shí)間序列的確定性分析
2.2.1確定性因素分解
任意一個(gè)時(shí)間序列分析都可分解為由多項(xiàng)式?jīng)Q定的確定性趨勢(shì)分析和由平穩(wěn)的零均值誤差成分。對(duì)于平穩(wěn)序列,這兩種影響對(duì)序列的作用都是穩(wěn)定的,而非平穩(wěn)序列所受到的兩種影響至少有一種是不穩(wěn)定的,這也是非平穩(wěn)序列產(chǎn)生的機(jī)理。
2.2.2趨勢(shì)分析
一、指數(shù)平滑法
1、簡(jiǎn)單指數(shù)平滑
適用于非季節(jié)性變動(dòng),處于恒定水平、沒(méi)有明顯趨勢(shì)的時(shí)間序列,可對(duì)其進(jìn)行短期預(yù)測(cè)。
2、Holt兩參數(shù)指數(shù)平滑
適用于對(duì)含有線性趨勢(shì)、無(wú)季節(jié)性的序列進(jìn)行修勻。適用于對(duì)含有線性趨勢(shì)、無(wú)季節(jié)性的序列進(jìn)行修勻?;舅枷胧羌俣ㄐ蛄杏忻科谶f增或遞減的固定趨勢(shì)趨勢(shì)變動(dòng)值,則第前一期的觀察值加上每期固定的趨勢(shì)變動(dòng)值就應(yīng)該等于該期的估計(jì)值。
3、HW指數(shù)平滑
此模型為指數(shù)平滑方法的一種,包括想加模型以及相乘模型。主要適用于有增長(zhǎng)或降低趨勢(shì)、季節(jié)性變化的時(shí)間序列。
二、季節(jié)效應(yīng)分析
具有季節(jié)效應(yīng)的時(shí)間序列的特點(diǎn)是事件呈現(xiàn)出了固定周期性變動(dòng)。具體步驟分為三步:計(jì)算周期內(nèi)的各期平均數(shù);計(jì)算總平均數(shù);季節(jié)指數(shù)等于時(shí)期平均數(shù)除以總平均數(shù)。
季節(jié)指數(shù)比值比1大,表示高于平均值,比值比1小,表示低于平均值,若都等于1表示序列無(wú)明顯的季節(jié)效應(yīng)。
2.3非平穩(wěn)時(shí)間序列的隨機(jī)性分析
2.3.1差分運(yùn)算
對(duì)于觀察值序列,無(wú)論選取的是確定性還是隨機(jī)性的方法,都首先需要進(jìn)行的是將序列中的確定性信息采用有效的手段提取出來(lái)。提取確定性信息的方法是差分運(yùn)算的實(shí)質(zhì)。
若序列蘊(yùn)含固定周期,若想要比較好的提取周期信息,一般采用進(jìn)行步長(zhǎng)為周期長(zhǎng)度的差分運(yùn)算。
2.3.2求和自回歸移動(dòng)平均模型
許多非平穩(wěn)序列差分后會(huì)顯示出平穩(wěn)序列的性質(zhì)。這說(shuō)明任何非平穩(wěn)序列若能通過(guò)有效手段使序列平穩(wěn)化,可以對(duì)處理后的序列進(jìn)行模型擬合,而這個(gè)有效的手段就是上文介紹的適當(dāng)階數(shù)的差分運(yùn)算。
第3章 基于時(shí)間序列的民航客運(yùn)量分析
3.1民航客運(yùn)量數(shù)據(jù)
2013年1月到2017年12月民航客運(yùn)量人數(shù)(萬(wàn)人),數(shù)據(jù)來(lái)源于中國(guó)統(tǒng)計(jì)年鑒。
3.2指數(shù)平滑法模型的建立
分別為采用三種平滑法的樣本內(nèi)實(shí)際值與樣本內(nèi)預(yù)測(cè)值的擬合效果。從圖中很難看出哪一種模型更適合對(duì)原始時(shí)間序列的擬合。
可以通過(guò)比較樣本內(nèi)誤差的誤差平方和來(lái)進(jìn)行模型的取舍。由三種模型的樣本內(nèi)預(yù)測(cè)誤差的誤差平方和可以得出HW >平滑簡(jiǎn)單指數(shù)平滑>Holt兩參數(shù)指數(shù)平滑,可見(jiàn)HW指數(shù)平滑模型要比簡(jiǎn)單指數(shù)平滑模型、霍特雙參數(shù)指數(shù)模型的精度都要高。因此,本文在指數(shù)平滑法里選擇H-W模型進(jìn)行分析預(yù)測(cè)。通過(guò)STL分解進(jìn)行進(jìn)一步的驗(yàn)證,第一行為原始數(shù)據(jù)、第二行為季節(jié)成分、第三行為趨勢(shì)成分以及第四行的剩余誤差成分。我們可以發(fā)現(xiàn)是季節(jié)項(xiàng)影響、趨勢(shì)項(xiàng)影響是影響序列的主要因素,剩余誤差部分是非隨機(jī)的波動(dòng),由于其影響很小無(wú)法用模型來(lái)描述,模型擬合時(shí)可以忽略。該模型非常成功的預(yù)測(cè)了季節(jié)峰值,其峰值大約發(fā)生在每年8月份左右。
Stl分解擬合結(jié)果中,意味著當(dāng)期預(yù)測(cè)值基于平衡了最近和較遠(yuǎn)期的觀測(cè)值。為0表明趨勢(shì)項(xiàng)影響因素在整個(gè)時(shí)間序列上不變,也就是初始值,這與我們的直觀感受是相符的,民航客運(yùn)量的趨勢(shì)部分斜率基本是不變的,水平改變則比較多。
3.3季節(jié)效應(yīng)分析
時(shí)間序列的分解即估計(jì)出趨勢(shì)、季節(jié)和不規(guī)則部分。R中可將時(shí)間序列的趨勢(shì)部分季節(jié)部分估計(jì)出來(lái),同時(shí)還可以估計(jì)出時(shí)間序列的不規(guī)則部分。本文選擇相乘模型進(jìn)行分析,首先提取模型中的趨勢(shì)項(xiàng)影響因素,再使用線性模型進(jìn)行擬合。
模型診斷得回歸模型擬合效果一般,殘差在0值附近波動(dòng)較大,且不服從正態(tài)分布,殘差出現(xiàn)了明顯的自相關(guān)性。優(yōu)化解決方法就是在季節(jié)效應(yīng)分析時(shí)針對(duì)季節(jié)性影響提取出序列的季節(jié)因子,將季節(jié)因子與線性擬合的趨勢(shì)項(xiàng)預(yù)測(cè)數(shù)據(jù)相乘就可以得到預(yù)測(cè)值。因此,可以通過(guò)提取出季節(jié)因子的方法得到季節(jié)指數(shù)sea。
8月份的季節(jié)指數(shù)最大,說(shuō)明8月份是民航客運(yùn)量最大的月的,12月份的季節(jié)指數(shù)最小,說(shuō)明12月份的民航客運(yùn)量最小。與原始序列所觀察結(jié)果十分符合,所以可以認(rèn)為提取出季節(jié)因子的模型能夠很好對(duì)民航客運(yùn)量進(jìn)行擬合預(yù)測(cè)。
3.4ARIMA模型建立
由差分運(yùn)算的實(shí)質(zhì)可知提取確定性信息的方法可以采用差分運(yùn)算,我們可以通過(guò)1階差分來(lái)提取趨勢(shì)的影響;可以通過(guò)2階或3階差分來(lái)提取曲線趨勢(shì)的影響;提取周期性信息時(shí)則可以通過(guò)歩長(zhǎng)為周期的差分運(yùn)算來(lái)實(shí)現(xiàn)平穩(wěn)性。通過(guò)差分使非平穩(wěn)序列顯示平穩(wěn)性的差分后平穩(wěn)序列,是可以用ARIMA模型來(lái)擬合的差分平穩(wěn)序列。
本文進(jìn)行時(shí)間序列的分析主要是通過(guò)R軟件來(lái)實(shí)現(xiàn)的,首先通過(guò)R軟件作出民航客運(yùn)量原始數(shù)據(jù)的時(shí)間序列圖,可根據(jù)觀察時(shí)間序列圖中民航客運(yùn)量呈現(xiàn)出的遞增的趨勢(shì)性來(lái)初步判斷序列是不平穩(wěn)的。同時(shí)還可以發(fā)現(xiàn)序列的季節(jié)因素很明顯,每一年份的民航客運(yùn)量變動(dòng)都是有規(guī)律的。因此為了是序列平穩(wěn)化,我們可以嘗試對(duì)數(shù)據(jù)做差分,通過(guò)使差分之后的序列平穩(wěn),進(jìn)行ARIMA模型的擬合。
1階差分之后的序列可能已經(jīng)平穩(wěn)了。為了驗(yàn)證我們的判斷是否正確,對(duì)差分之后的序列進(jìn)行檢驗(yàn)。
本文判斷序列平穩(wěn)的手段是單位根檢驗(yàn)。在R中ADF的檢驗(yàn)里,得到1階差分以后的序列的P值為0.01,就可以認(rèn)為拒絕不平穩(wěn)的零假設(shè),說(shuō)明1階差分后的序列平穩(wěn)??捎肦來(lái)進(jìn)行模型的定階與取舍。根據(jù)AIC準(zhǔn)則應(yīng)該優(yōu)先考慮AIC值較小的模型,所以最優(yōu)模型階數(shù)為為 (1,1,1) ,模型的信息赤函池準(zhǔn)則數(shù)值為AIC,BIC均為最小的。接下來(lái)對(duì)該模型進(jìn)行估計(jì)診斷,采用LB統(tǒng)計(jì)量來(lái)檢驗(yàn)?zāi)P偷臍埐钍欠駷榘自肼暋?/p>
由P值顯著大于顯著性水平=0.05,因此可以判斷殘差序列為白噪聲序列。此ARIMA模型擬合效果較好 。
3.5民航客運(yùn)量預(yù)測(cè)及模型比較
兩模型都可得出相應(yīng)的預(yù)測(cè)區(qū)間,而季節(jié)效應(yīng)分析無(wú)法得知預(yù)測(cè)的精度,所以優(yōu)先選擇前兩個(gè)對(duì)原始序列進(jìn)行擬合。
可根據(jù)模型的預(yù)測(cè)誤差來(lái)進(jìn)行模型的取舍。由預(yù)測(cè)誤差的時(shí)間曲線圖看出后者的預(yù)測(cè)誤差值相對(duì)較小。
由預(yù)測(cè)誤差的直方圖可以看出第二個(gè)模型的預(yù)測(cè)誤差符合正態(tài)分布。綜上所訴,發(fā)現(xiàn)第二個(gè)模型能夠好的對(duì)未來(lái)值作出預(yù)測(cè),因此最終選擇H-W進(jìn)行預(yù)測(cè)。
2018年民航客運(yùn)量每月份的預(yù)測(cè)值如下: