劉 夏,李苑輝,歐志鵬,陳 磊,陳明銳
(1.三亞航空旅游職業(yè)學(xué)院,海南 三亞 572000;2.海南大學(xué) 計(jì)算機(jī)與網(wǎng)絡(luò)空間安全學(xué)院,海口 570228)
預(yù)測交通客流量的方法較多,國內(nèi)學(xué)者在時間序列方面:孫泗龍(2014)[1]、宋子房(2014)[2]、芮少權(quán)(2010)[3]、張嘉成(2016)[4]均構(gòu)建了時間序列ARIMA模型用于客流量預(yù)測,但預(yù)測精度仍可提高。在在灰色理論方面:李克昭(2016)構(gòu)建了優(yōu)化后的灰色馬爾科夫模型[5],樊冬雪(2015)構(gòu)建了粒子群無偏灰色馬爾科夫鏈模型[6],張國帥(2011)將累積法引入到傳統(tǒng)灰色馬爾科夫模型[7],楊軍(2013)構(gòu)建基于累積法的灰色馬爾科夫模型[8],朱念(2017)構(gòu)建灰色馬爾科夫模型進(jìn)行了預(yù)測[9],顧炯(2014)建立基于灰色預(yù)測的城市軌道交通短期客流預(yù)測模型[10]。此外,曾冬玲(2016)[11]用馬爾科夫模型修正灰色模型,預(yù)測了云南旅游市場未來3年的客流。湯銀英(2018)邵夢汝(2016)、王慧勇(2016)、付建飛(2014)、安然(2015)等學(xué)者也從不同的角度將灰色理論分別改進(jìn)馬爾科夫模型[12]、神經(jīng)網(wǎng)絡(luò)模型[13]、線性回歸模型[14]并用于預(yù)測。在國外的研究方面,Liu X(2017)在使用了ARMA、灰色預(yù)測GM(1,1)以及ARMA改進(jìn)回歸模型對客流量進(jìn)行了預(yù)測[15]。Xia L(2017)運(yùn)用灰色預(yù)測方法對航線客流量的預(yù)測的精確度較高,對航空公司預(yù)估客流量和制訂銷售政策有直接的指導(dǎo)意義[16]。Nieto María Rosa構(gòu)建了基于ARIMA+GARCH的模型用于客流預(yù)測[17]。IslamB將改進(jìn)的反向傳播神經(jīng)網(wǎng)絡(luò)與混沌搜索遺傳算法和模擬退火算法相結(jié)合用于電力預(yù)測。
選取了三亞市旅游政務(wù)網(wǎng)公布的2012—2017每年1月—12月的三亞市旅游統(tǒng)計(jì)月度數(shù)據(jù),在經(jīng)過清洗后,選取了來自機(jī)場和火車站的客流數(shù)據(jù)總量作為研究對象。
1.2.1 ARIMA
Box與Jenkins在20世紀(jì)70年代首先提出了ARIMA模型。ARIMA模型在時間序列預(yù)測方面適用十分廣泛,它的全稱是自回歸積分滑動平均模型[1]。ARIMA(p,d,q)稱為差分自回歸移動平均模型,AR代表的是自回歸,p則為自回歸項(xiàng);MA用于代表移動平均,當(dāng)中的q則用于表示移動平均的具體項(xiàng)數(shù),字母d則代表時間的序列,即表示移動平均,q代表的是MA移動平均的項(xiàng)數(shù),d表示時間的序列,用于表示在平穩(wěn)狀態(tài)下需要進(jìn)行差分分析的次數(shù)。ARIMA模型作為一種回歸分析模型,具體是針對非平穩(wěn)時間序列進(jìn)行轉(zhuǎn)化,使其變成平穩(wěn)時間序列,在此基礎(chǔ)上分析因變量、隨機(jī)誤差項(xiàng)對應(yīng)的滯后值以及隨現(xiàn)值等?;谠蛄械钠椒€(wěn)性與回歸包括因素角度,能夠?qū)RIMA模型劃分成多個過程。
1.2.2 灰色馬爾科夫介紹
依據(jù)過去的已有探究能夠知道,對于灰色預(yù)測來講,遇到那些具備一定規(guī)律,同時變化率相對較小的數(shù)據(jù)序列,其預(yù)測的精準(zhǔn)度相對較高,然而當(dāng)遇到那些變化沒有規(guī)律的數(shù)據(jù)序列時,很難將其預(yù)測的精準(zhǔn)度控制在相對較小的范圍里。對于馬爾科夫鏈而言,其預(yù)測的對象是隨機(jī)變化的,是一個呈動態(tài)變化的系統(tǒng),對于數(shù)據(jù)的未來變化趨勢是依據(jù)當(dāng)下呈現(xiàn)狀態(tài)的轉(zhuǎn)移概率來進(jìn)行推測的,側(cè)面體現(xiàn)了預(yù)測結(jié)果受每個影響因素所影響的程度,所以,對于那些原始數(shù)據(jù)起伏變化的系統(tǒng)開展預(yù)測,馬爾科夫鏈?zhǔn)亲钸m合的。要想對灰色預(yù)測模型具有的缺陷加以彌補(bǔ),就要把馬爾科夫鏈和其加以整合,充分發(fā)揮兩者的優(yōu)勢,預(yù)測的精準(zhǔn)度才能得以大幅提升?;疑R爾科夫模型可以劃分成灰色轉(zhuǎn)移狀態(tài)與灰色轉(zhuǎn)移概率兩類模型,所采用的是前者,即灰色轉(zhuǎn)移狀態(tài)馬爾科夫模型,常規(guī)而言,它有3個步驟:
第1步,預(yù)測狀態(tài)的劃分。
第2步,狀態(tài)轉(zhuǎn)移概率矩陣的創(chuàng)建,如式(1)與式(2)所示:
(1)
(2)
在式(2)當(dāng)中:Pij對應(yīng)的是一步轉(zhuǎn)移概率,其范圍在狀態(tài)i至狀態(tài)j之間,Mij對應(yīng)的是一步轉(zhuǎn)移次數(shù),其范圍也是在狀態(tài)i至狀態(tài)j之間,Mi對應(yīng)的是狀態(tài)數(shù)量,該數(shù)量歸屬于狀態(tài)i。
(3)
針對以上論述的月旅客數(shù)量,運(yùn)用傳統(tǒng)的時間序列模型ARIMA對其加以預(yù)測與擬合。
用傳統(tǒng)的時間序列ARIMA模型,對上述的每月旅客數(shù)進(jìn)行擬合和預(yù)測。要在ARIMA模型創(chuàng)建之前,先做出航線的時序圖,得到的結(jié)果如圖1所示。
圖1 每月客流量時序圖
根據(jù)圖1能夠獲取月旅客量,顯示出其季節(jié)因素極為顯著,每一年旅客數(shù)量較少的月份是7、8、9三個月,旅客數(shù)量較多的月份在1、2、3三個月。旅客數(shù)量的季節(jié)調(diào)整可運(yùn)用X-12季節(jié)調(diào)整法來得以開展,所得到的每月季節(jié)指數(shù)具體可見表1:
表1 每月季節(jié)指數(shù)列表
接著對調(diào)整后的月旅客數(shù)量進(jìn)行單位根檢驗(yàn),檢驗(yàn)的結(jié)果如表2所示。
表2 調(diào)整之后的旅客數(shù)量單位根檢驗(yàn)列表
根據(jù)表2可得調(diào)整后的每月旅客數(shù)是一階單整序列,所以,創(chuàng)建的模型要是ARIMA(p,1,q)模型。
針對NUM具體情況,將其ACF與PACF圖畫出,識別p和q,得到的結(jié)果如圖2所示。
圖2 D(passenger_num)的ACF和PACF圖
根據(jù)圖2的ACF和PACF可以得出,D(passenger_num)所對應(yīng)的PACF圖顯示出的現(xiàn)象是1期“截尾”,相對于ACF圖而言,其顯示出的現(xiàn)象則是“拖尾”,結(jié)合AIC值最小原則。最后對交通旅客數(shù)初步建立ARIMA(1,1,0)。基于多次調(diào)試,最后得出和表3顯示出的ARIMA(1,1,0)模型的結(jié)果。
表3 ARIMA的結(jié)果
從表2、表3所提供的數(shù)據(jù)可知,在0.05的顯著水平情況下,模型總似然比檢驗(yàn)和ARIMA(1,1,0)的各項(xiàng)系數(shù)都是顯著的,因此可獲得方程:
D(passenger_num)t=189.381 4-
0.919 1D(passenger_num)t-1
(4)
針對以上論述模型的殘差加以檢驗(yàn)的基礎(chǔ)上,將殘差的ACF與PACF圖畫出,對其模型進(jìn)行觀察,看旅客數(shù)序列的有效信息有沒有全部提取,圖3顯示的就是所獲取的結(jié)果:
圖3 殘差對應(yīng)的ACF與PACF圖
殘差序列的ACF和PACF通過圖3可知大體都在兩個標(biāo)準(zhǔn)差之后,顯示出以上所述的模型對序列的全部信息都進(jìn)行了有效提取。在此基礎(chǔ)上,月旅客數(shù)可運(yùn)用所創(chuàng)建的ARIMA(1,1,0)模型加以預(yù)測。
(5)
其中YF1表示每月旅客數(shù)的預(yù)測序列,Sj表示每月的季節(jié)指數(shù)。計(jì)算預(yù)測的平均絕對百分誤差。
(6)
按照以上創(chuàng)建的ARIMA(1,1,0)來針對每月交通旅客量進(jìn)行預(yù)測,其MAPE=4.42%。
依照圖1可以看出2012—2017年交通旅客量具有明顯的季節(jié)趨勢,采用2012—2017年的每個月?lián)碛械穆每蛿?shù)量作為原始數(shù)據(jù),在此基礎(chǔ)上創(chuàng)建出灰色馬爾科夫預(yù)測模型,分組展開預(yù)測,這樣季節(jié)效應(yīng)對預(yù)測所產(chǎn)生的影響就可得以有效規(guī)避。
先進(jìn)行灰色預(yù)測,以2012—2017-01的旅客數(shù)作為例子建立具體的灰色馬爾科夫預(yù)測模型。
表4 灰色預(yù)測值
第三,對灰色預(yù)測的殘差進(jìn)行狀態(tài)劃分,對預(yù)測誤差進(jìn)行劃分3個不同的狀態(tài)空間E1,E2,E3,具體劃分如下所示:
E1=(36.44,-13.69),E2=(-13.69,9.07),E3=(9.07,31.82)
根據(jù)上述的劃分,可以得出在2012—2017-01月E1狀態(tài)有1次,E2狀態(tài)有3次,E3狀態(tài)有1次。
最后,將預(yù)測值計(jì)算出來,按照狀態(tài)的劃分,將預(yù)測值狀態(tài)所屬殘差的組中值取出,然后和以上灰色預(yù)測的值進(jìn)行相加,精準(zhǔn)度更高的灰色馬爾科夫預(yù)測模型的預(yù)測值就能夠獲取。以2012-02的預(yù)測值計(jì)算為例:
Y=138.448 4+(36.44-13.69)/2=149.82
以此類推可以得到灰色馬爾科夫預(yù)測模型對2012—2017每年1月—12月的預(yù)測值,見表5。
表5 預(yù)測值列
根據(jù)表5可得,選用灰色馬爾科夫模型對2012-01—2017-01預(yù)測MAPE=3.70%,灰色預(yù)測模型的預(yù)測MAPE=8.13%,可知就兩者的預(yù)測精準(zhǔn)度而言,灰色預(yù)測模型與灰色馬爾科夫模型相比明顯落后。因此,應(yīng)用灰色馬爾科夫預(yù)測模型針對2012—2017-02-12的交通旅客量進(jìn)行預(yù)測,計(jì)算出的MAPE=3.78%。
比較ARIMA模型與灰色馬爾科夫模型對2012-01—2017-12的交通旅客量進(jìn)行預(yù)測,得到的預(yù)測時序如圖4:
圖4 兩個模型預(yù)測值
并且計(jì)算兩個模型的預(yù)測精度得到的值如表6所示:
表6 兩個模型預(yù)測精度比較
通過上述兩種模型的預(yù)測精度比較,選用預(yù)測精度較好的灰色馬爾科夫的模型對2018-01—12月的交通旅客量進(jìn)行預(yù)測。
首先計(jì)算2012—2017年每年1月的狀態(tài)轉(zhuǎn)移概率矩陣:
可以得到2012年1月交通旅客量所處的是E2狀態(tài),則初始向量:
得到2018-01的轉(zhuǎn)移概率為
計(jì)算得到2018-01的交通旅客量處在E1和E2的狀態(tài)的概率各為1/2。通過計(jì)算可以得到2018-01的交通旅客量為373.260 7萬人。根據(jù)同樣的計(jì)算方式得到2018-02-12的交通旅客量如表7。
表7 2018年旅客數(shù)的預(yù)測
通過使用不同的模型進(jìn)行建模及分析,在針對不同模型對應(yīng)的預(yù)測精度進(jìn)行對比之后,最后選擇的是灰色馬爾科夫預(yù)測模型,主要是因?yàn)槟P偷臉颖绢A(yù)測精準(zhǔn)度相對較高,能夠?qū)ξ磥硪荒杲煌每土勘容^精準(zhǔn)加以預(yù)測。根據(jù)預(yù)測情況,可以看出在每年2月作為三亞旅游的旺季,其交通旅客量可能突破400萬次,這對當(dāng)?shù)亟煌?、旅游等部門提前進(jìn)行工作部署具有重要的意義?;疑R爾科夫模型的方法和結(jié)果簡單易懂,可以推廣到其他相關(guān)領(lǐng)域客流量的預(yù)測。
從“吃住行游購?qiáng)省钡穆糜瘟貋砜?,交通是決定著一個城市旅游質(zhì)量的重要因素。與此同時,交通不僅服務(wù)于游客,也服務(wù)于市民,關(guān)乎每一個人的居住舒適度。對于一個常住人口61萬的小城,在旅游旺季單月接待超過400萬次的游客,對任何一座城市都是一個不小的挑戰(zhàn)。因此,三亞應(yīng)積極在建設(shè)外連交通的同時,逐步完善好自己的交通“內(nèi)動脈”,利用水資源和橋梁建設(shè)等手段完成城市交通一體化建設(shè)。積極利用數(shù)據(jù)手段進(jìn)行實(shí)時觀測,提前把握客流量的趨勢,向交通組織部門和運(yùn)力部門提前提供科學(xué)的數(shù)據(jù),充分做到提前部署、提前把控,全面提高交通管理能力。