李苑輝,劉 夏,歐志鵬
?
基于ARIMA模型的三亞機(jī)場(chǎng)客流量預(yù)測(cè)
李苑輝,劉 夏,歐志鵬
(三亞航空旅游職業(yè)學(xué)院 人文社科學(xué)院,海南 三亞 572000)
通過對(duì)2008年1月至2016年12月三亞機(jī)場(chǎng)的客流量數(shù)據(jù)進(jìn)行分析,發(fā)現(xiàn)其具有趨勢(shì)和季節(jié)的規(guī)律。通過構(gòu)建機(jī)場(chǎng)客流量的ARIMA預(yù)測(cè)模型并進(jìn)行檢驗(yàn),結(jié)果表明,ARIMA模型對(duì)客流量數(shù)據(jù)有著較好的擬合效果,預(yù)測(cè)誤差較小,可應(yīng)用于機(jī)場(chǎng)旅客吞吐量的短期預(yù)測(cè),為機(jī)場(chǎng)的運(yùn)營管理提供相應(yīng)決策依據(jù)。
客流量;ARIMA模型;預(yù)測(cè)
三亞鳳凰國際機(jī)場(chǎng)于1994年7月1日正式通航,初期的設(shè)計(jì)保障規(guī)模為旅客年吞吐量150萬人次.2007年,鳳凰機(jī)場(chǎng)年旅客吞吐量突破500萬人次;2011年,突破1000萬人次;2017年,超過1938萬人次,逼近2000萬人次大關(guān)。目前鳳凰機(jī)場(chǎng)的客流量已經(jīng)遠(yuǎn)遠(yuǎn)超過其設(shè)計(jì)保障能力,航站樓已處于超負(fù)荷運(yùn)行狀態(tài),造成了機(jī)場(chǎng)客運(yùn)高速增長與發(fā)展空間嚴(yán)重不足的矛盾,影響國際旅游島的形象,增加了機(jī)場(chǎng)安全運(yùn)營風(fēng)險(xiǎn)。
機(jī)場(chǎng)客流量預(yù)測(cè)對(duì)于機(jī)場(chǎng)未來規(guī)劃和管理措施改進(jìn)有重要意義??茖W(xué)準(zhǔn)確地預(yù)測(cè)鳳凰機(jī)場(chǎng)客流量的發(fā)展趨勢(shì),是確定合理的交通設(shè)施規(guī)模的基礎(chǔ)、保證機(jī)場(chǎng)設(shè)施高效率使用的前提,能夠?yàn)闄C(jī)場(chǎng)運(yùn)營管理提供科學(xué)決策依據(jù)。
本研究選擇2008~2017年三亞鳳凰機(jī)場(chǎng)的月度旅客吞吐量作為研究數(shù)據(jù),共120個(gè)數(shù)據(jù)樣本,其中2008~2016年108個(gè)樣本作為訓(xùn)練集進(jìn)行建模,2017年12個(gè)樣本作為測(cè)試集,檢驗(yàn)預(yù)測(cè)模型的性能。具體數(shù)據(jù)如表1所示。
為達(dá)到較高精度的預(yù)測(cè)成果,國內(nèi)外許多學(xué)者對(duì)不同的預(yù)測(cè)模型進(jìn)行了廣泛研究[1-3]。預(yù)測(cè)客流量的方法很多,據(jù)不完全統(tǒng)計(jì),世界上大約有約300種方法,其中有150多種比較成熟,30多種比較常用,10多種使用比較普遍,但根據(jù)不同的標(biāo)準(zhǔn),大體分為兩類:一類是線性理論和非線性理論,另一類是定性預(yù)測(cè)法和定量預(yù)測(cè)法,但總體都包括:時(shí)間序列模型、灰色預(yù)測(cè)模型、專家預(yù)測(cè)模型、指數(shù)平滑法、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、趨勢(shì)外推法、回歸分析法等[4]。
表1 2008~2017年三亞機(jī)場(chǎng)旅客吞吐量月度統(tǒng)計(jì)表(單位:萬人)
Tab.1 Monthly Statistics of Passenger Flow of Sanya Airport from 2008 to 2017 (unit: 10,000 people)
數(shù)據(jù)來源:三亞旅游官方政務(wù)網(wǎng)http://tour.sanya.gov.cn/tongji_yue.asp
國內(nèi)學(xué)者用不同的模型對(duì)機(jī)場(chǎng)客流量進(jìn)行預(yù)測(cè)研究,取得了一些成果。例如,王婷婷(2017)運(yùn)用灰色馬爾科夫模型對(duì)貴陽龍洞堡機(jī)場(chǎng)2006-2016年的旅客吞吐量數(shù)據(jù)進(jìn)行預(yù)測(cè),結(jié)果證明灰色馬爾科夫預(yù)測(cè)模型擁有較好的預(yù)測(cè)精度,平均年誤差為3.38%[5]。劉夏(2016)將Holt-Winter季節(jié)模型、ARMA模型和線性回歸模型加權(quán)組合對(duì)三亞機(jī)場(chǎng)客流量進(jìn)行預(yù)測(cè),經(jīng)驗(yàn)證該方法可以作為有效預(yù)測(cè)機(jī)場(chǎng)客流量,平均年誤差為3.98%[4]。黃邦菊(2013)建立了多元線性回歸模型預(yù)測(cè)西南某機(jī)場(chǎng)的旅客吞吐量,平均年誤差為2.49%[6]。屈拓(2012)將灰色模型和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合,建立組合預(yù)測(cè)模型,預(yù)測(cè)成都機(jī)場(chǎng)的旅客吞吐量,平均誤差為2.74%[7]。
由此觀之,不同模型的預(yù)測(cè)精度有著明顯的差別。而在短期預(yù)測(cè)方面,ARIMA模型是一種精確度較高的方法,國內(nèi)學(xué)者已經(jīng)應(yīng)用于不同領(lǐng)域的預(yù)測(cè)。例如,薛冬梅(2010)根據(jù)吉林省過去十六年的全社會(huì)固定資產(chǎn)投資總額數(shù)據(jù),運(yùn)用ARIMA(3,1,2)模型對(duì)吉林省今后五年的全社會(huì)固定資產(chǎn)投資進(jìn)行了預(yù)測(cè)分析[8]。周葉(2010)根據(jù)2002年1月至2009年12月我國航空貨運(yùn)量月度數(shù)據(jù),采用ARIMA (1,1,1)模型,對(duì)往后六個(gè)月的貨運(yùn)量進(jìn)行了預(yù)測(cè)[9]。張小斐(2006)以1978~2003年我國的國內(nèi)生產(chǎn)總值作為樣本資料,采用平滑ARIMA(1,1,2)時(shí)序模型,對(duì)往后四年的我國國內(nèi)生產(chǎn)總值作出預(yù)測(cè)[10]。以上擬合值均與實(shí)際觀察值非常接近(誤差小于5%),具有較高的預(yù)測(cè)精度,表明ARIMA(p,d,q)模型應(yīng)用于短期的時(shí)間序列預(yù)測(cè)是有效可行的。
一個(gè)地方的機(jī)場(chǎng)旅客吞吐量受到當(dāng)?shù)禺a(chǎn)業(yè)結(jié)構(gòu)、節(jié)假日安排、航線安排、機(jī)票定價(jià)和氣候等多種不同因素的影響,往往兼具周期性和非線性變化的特性。三亞作為旅游城市,淡旺季差異明顯,來訪旅客月度數(shù)量縱向比較波動(dòng)較大(見表1),具有明顯的季節(jié)性特征。因旅客吞吐量月度數(shù)據(jù)包含季節(jié)變化,考慮采用ARIMA(sp,sd,sq)S(1)季節(jié)模型.
因此,本文擬綜合ARIMA(p,d,q)模型與ARIMA (sp,sd,sq)S(1)季節(jié)模型,構(gòu)建復(fù)合季節(jié)模型,對(duì)三亞機(jī)場(chǎng)的旅客吞吐量進(jìn)行預(yù)測(cè)分析,以期為本地的航空客運(yùn)市場(chǎng)調(diào)控和發(fā)展提供理論支持。
ARIMA模型,又叫求和自回歸移動(dòng)平均(Auto Regressive Integrated Moving Average)模型, 簡記為ARIMA(p, d, q)模型,是由美國學(xué)者博克思(Box)和英國學(xué)者詹金斯(Jenkins)于20世紀(jì)70年代提出的時(shí)間序列預(yù)測(cè)模型,又稱為Box-Jenkins模型,亦簡稱B-J模型。
其建模思想是將預(yù)測(cè)對(duì)象隨時(shí)間變化形成的序列看作是一個(gè)隨機(jī)序列,并用相應(yīng)的數(shù)學(xué)模型加以近似描述,通過對(duì)相應(yīng)數(shù)學(xué)模型的分析研究,更本質(zhì)地認(rèn)識(shí)這些動(dòng)態(tài)數(shù)據(jù)的內(nèi)在結(jié)構(gòu)和復(fù)雜特性,從而達(dá)到在最小方差意義下的最佳預(yù)測(cè)。
ARIMA模型具有如下結(jié)構(gòu):
由ARIMA模型結(jié)構(gòu)可知:
即ARIMA(p,d,q)模型是由差分運(yùn)算與ARMA (p,q)模型組合而成。由于差分運(yùn)算具有強(qiáng)大的確定性信息提取能力,說明非平穩(wěn)序列只要通過適當(dāng)階數(shù)的差分后平穩(wěn),就可以用ARIMA(p,d,q)模型對(duì)時(shí)間序列進(jìn)行擬合[11]。
對(duì)于以月、季度為時(shí)間單位的序列,數(shù)據(jù)經(jīng)常包含季節(jié)變化。季節(jié)模型(Seasonal Model)和連續(xù)序列一樣,只是連續(xù)模型的時(shí)間單位是1,而季節(jié)模型的時(shí)間單位是相應(yīng)的周期S。季節(jié)求和自回歸移動(dòng)平均模型ARIMA(sp,sd,sq)S(1)可以表示為:
且規(guī)定:
將ARIMA(p,d,q)模型與ARIMA(sp,sd,sq)S(1)綜合在一起,得到復(fù)合季節(jié)模型(General Multiplicative Seasonal Models),它是相乘模型。對(duì)于一般的序列,復(fù)合季節(jié)模型能得到較為滿意的結(jié)果[12]。其模型結(jié)構(gòu)為:
記為:ARIMA(p,d,q)(sp,sd,sq)S(1),即為ARIMA模型的一般形式。其中,p是自回歸模型的階數(shù),d是差分的階數(shù),q是移動(dòng)平均的階數(shù),sp是季節(jié)模型的自回歸階數(shù),sd是季節(jié)差分的階數(shù),sq是季節(jié)模型的移動(dòng)平均階數(shù),S是季節(jié)周期[13]。
如果序列是平穩(wěn)的,進(jìn)入下一個(gè)步驟,否則進(jìn)行差分運(yùn)算,使得序列變得平穩(wěn)。
根據(jù)表1的數(shù)據(jù),用SPSS 19作出旅客數(shù)的時(shí)序圖,如圖1所示。由圖1可知,三亞機(jī)場(chǎng)的旅客吞吐量呈整體上升趨勢(shì)和季節(jié)性周期波動(dòng)(周期為12個(gè)月),因此旅客數(shù)的數(shù)據(jù)具有趨勢(shì)和季節(jié)的規(guī)律,可以初步判斷為非平穩(wěn)序列。為進(jìn)一步判定,下面作出自相關(guān)圖和偏相關(guān)圖,如圖2和圖3所示。
圖1 旅客數(shù)的序列圖
圖2 旅客數(shù)的自相關(guān)圖
圖3 旅客數(shù)的偏相關(guān)圖
從圖2和圖3可以看出,旅客數(shù)數(shù)據(jù)的自相關(guān)函數(shù)和偏相關(guān)函數(shù)都是拖尾的,并未衰減到0,因此數(shù)據(jù)序列是非平穩(wěn)的。
為消除趨勢(shì)信息,對(duì)原始序列做一階差分。一階差分的運(yùn)算公式為:
同時(shí)要清除季節(jié)信息,需對(duì)數(shù)據(jù)做一階季節(jié)差分。一階季節(jié)差分的運(yùn)算公式為:
分別做完一階差分和一階季節(jié)差分后,作出時(shí)序圖,如圖4所示。
圖4 旅客數(shù)一階差分時(shí)序圖
由圖4可以看出,數(shù)據(jù)的方差有逐漸增大的趨勢(shì)。為消除方差的變化,對(duì)數(shù)據(jù)進(jìn)行自然對(duì)數(shù)轉(zhuǎn)換,再作出時(shí)序圖,如圖5所示。從圖5初步可以判斷,旅客數(shù)序列此時(shí)已經(jīng)基本平穩(wěn)。
圖5 對(duì)數(shù)轉(zhuǎn)換后的一階差分時(shí)序圖
為進(jìn)一步驗(yàn)證差分運(yùn)算后序列的平穩(wěn)性,作出自相關(guān)函數(shù)和偏相關(guān)函數(shù)的圖,如圖6、圖7所示。可以看出此時(shí)數(shù)據(jù)基本平穩(wěn)。
圖6 一階差分后的自相關(guān)圖
圖7 一階差分后的偏相關(guān)圖
現(xiàn)在分別對(duì)各個(gè)模型進(jìn)行擬合,然后根據(jù)可決系數(shù)R方和正態(tài)化BIC的值作出判斷。R方值越大、BIC值越小的模型擬合效果越好。最終需要在以上所有可能的模型中選擇一個(gè)最優(yōu)的模型。
利用SPSS軟件進(jìn)行建模,對(duì)各個(gè)可能的(p,q) (sp,sq)組合反復(fù)檢驗(yàn)與比較,如表2所示(為顯示簡潔,略去R方值較小且BIC值較大的數(shù)據(jù))。盡管ARIMA(1,1,1)(0,1,1)模型可決系數(shù)略小于其它模型, 但它的標(biāo)準(zhǔn)化BIC值最小,因此,最終選擇的擬合模型為ARIMA(1,1,1)(0,1,1)S(12)模型。
表2 各種模型擬合效果表
Tab.2 Various model fitting effects
根據(jù)所選擇的模型進(jìn)行擬合,結(jié)果如表3所示。
表3 模型統(tǒng)計(jì)量
Tab.3 Model statistics
從表中可以看出,模型能解釋原來序列中97.1%的信息,N-BIC值最小,Ljung-Box統(tǒng)計(jì)量的值顯著,說明ARIMA(1,1,1)(0,1,1)S(12)模型擬合時(shí)間序列數(shù)據(jù)的效果比較理想。
根據(jù)所選擇的ARIMA(1,1,1)(0,1,1)S(12)模型,應(yīng)用SPSS 19統(tǒng)計(jì)軟件對(duì)2017年1~12月三亞機(jī)場(chǎng)的旅客吞吐量進(jìn)行預(yù)測(cè),結(jié)果如表4和圖8所示。從表4可看出預(yù)測(cè)值的誤差絕對(duì)值大多低于5%,年度總誤差的絕對(duì)值小于2%;從圖8可以看到觀察值與擬合值幾乎重合。因此,該ARIMA模型能很好地應(yīng)用于預(yù)測(cè)三亞機(jī)場(chǎng)的客流量。
表4 2017年客流量預(yù)測(cè)值與實(shí)際值比較(單位:萬人)
Tab.4 Comparison Between Predicted Value and Actual Value of Passenger Flow in 2017 (Unit: 10,000)
現(xiàn)在用ARIMA(1,1,1)(0,1,1)S(12)模型預(yù)測(cè)三亞機(jī)場(chǎng)2018年和2019年的月度客流量,結(jié)果如表5所示。
表5 兩年的月度客流量預(yù)測(cè)(單位:萬人)
Tab.5 Monthly forecast of passenger volume in two years (Unit: 10,000)
(1)根據(jù)2008年1月至2016年12月三亞機(jī)場(chǎng)的客流量數(shù)據(jù)分析來看,其具有趨勢(shì)和季節(jié)的規(guī)律。三亞作為旅游城市,淡旺季差異明顯,容易使得民航市場(chǎng)旺季時(shí)運(yùn)力緊張,淡季時(shí)運(yùn)力閑置。若能預(yù)估進(jìn)出港客流量,提前合理安排運(yùn)力,可帶來明顯的經(jīng)濟(jì)效益和社會(huì)效益。
(2)通過構(gòu)建機(jī)場(chǎng)客流量的ARIMA模型并進(jìn)行檢驗(yàn),結(jié)果表明,ARIMA模型對(duì)三亞機(jī)場(chǎng)的客流量進(jìn)行預(yù)測(cè)是可行和可靠的,預(yù)測(cè)精度較高,誤差較小,可以為機(jī)場(chǎng)的運(yùn)營管理提供決策依據(jù)。
[1] 張金飛, 黎英, 高偉, 等.城市交通路口短時(shí)流量預(yù)測(cè)[J]. 軟件, 2018, 39(1): 126-131.
[2] 崔仁桀. 數(shù)據(jù)挖掘在學(xué)生專業(yè)成績預(yù)測(cè)上的應(yīng)用[J]. 軟件, 2016, 37(01): 24-27.
[3] 楊振宇. 高校招生數(shù)據(jù)采集及分析系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)[J]. 軟件, 2015, 36(5): 61-66.
[4] 劉夏, 陳磊, 李苑輝, 等. 基于組合方法的三亞機(jī)場(chǎng)客流量預(yù)測(cè)[J]. 計(jì)算機(jī)系統(tǒng)應(yīng)用, 2016, 25(8): 23-28.
[5] 王婷婷, 王紫晨. 基于灰色馬爾科夫?qū)埗幢C(jī)場(chǎng)旅客吞吐量預(yù)測(cè)[J]. 交通科技與經(jīng)濟(jì), 2017, 19(5): 48-51.
[6] 黃邦菊, 林俊松, 鄭瀟雨, 等. 基于多元線性回歸分析的民用運(yùn)輸機(jī)場(chǎng)旅客吞吐量預(yù)測(cè)[J]. 數(shù)學(xué)的實(shí)踐與認(rèn)識(shí), 2013, 43(4): 172-178.
[7] 屈拓. 組合模型在機(jī)場(chǎng)旅客吞吐量預(yù)測(cè)中的應(yīng)用[J]. 計(jì)算機(jī)仿真, 2012, 29(4): 108-111.
[8] 薛冬梅. ARIMA模型及其在時(shí)間序列分析中的應(yīng)用[J]. 吉林化工學(xué)院學(xué)報(bào), 2010, 27(3): 80-83.
[9] 周葉, 肖靈機(jī). 基于ARIMA模型的我國航空貨運(yùn)量預(yù)測(cè)分析[J]. 南昌航空大學(xué)學(xué)報(bào), 2010, 9(12): 22-27.
[10] 張小斐, 田金方. 基于ARIMA模型的短時(shí)序預(yù)測(cè)模型研究與應(yīng)用[J]. 統(tǒng)計(jì)新論, 2006, 10: 7-9.
[11] 游皓麟. R語言預(yù)測(cè)實(shí)戰(zhàn)[M], 北京:電子工業(yè)出版社, 2016: 365-366.
[12] 張文彤, 董偉. SPSS統(tǒng)計(jì)分析高級(jí)教程[M]. 北京: 高等教育出版社, 2013: 404-405.
[13] 夏怡凡. SPSS統(tǒng)計(jì)分析精要與實(shí)例詳解[M]. 北京: 電子工業(yè)出版社, 2010: 265-266.
Passenger Flow Forecast of Sanya Airport Based on ARIMA Model
LI Yuan-hui, LIU Xia, OU Zhi-peng
(School of Humanities and Social Sciences, Sanya Aviation and Tourism College. Sanya 572000, China)
By analyzing the passenger flow data of Sanya Airport collected from January 2008 to December 2016, the general trend and seasonal variation regular-ity of the passenger flow can be found. By constructing and testing the ARIMA forecast model, the results show that the ARIMA model has a good fitting effect on the passenger flow data, and its forecast error is small. Therefore, this model can be applied into the short-term forecast of airport passenger flow, and help to provide the corresponding decision-making basis for the airport operation man-agement.
Passenger flow; ARIMA model; PredictionIntroduction
O211.61
A
10.3969/j.issn.1003-6970.2018.07.009
海南省自然科學(xué)基金項(xiàng)目(批準(zhǔn)號(hào):618QN258)、三亞市院地科技合作項(xiàng)目(批準(zhǔn)號(hào):2014YD52)
劉夏(1983-),男,副教授,主要研究方向:計(jì)算機(jī)應(yīng)用;歐志鵬(1973-),男,講師,主要研究方向:管理學(xué)。
李苑輝(1982-),男,講師,主要研究方向:數(shù)據(jù)挖掘。
本文著錄格式:李苑輝,劉夏,歐志鵬. 基于ARIMA模型的三亞機(jī)場(chǎng)客流量預(yù)測(cè)[J]. 軟件,2018,39(7):42-47