陳 榮,梁昌勇,陸文星,董駿峰,葛立新
(1.蚌埠學(xué)院經(jīng)濟(jì)與管理學(xué)院,安徽 蚌埠 233000;2.合肥工業(yè)大學(xué)管理學(xué)院,安徽 合肥 230009;3.蚌埠學(xué)院理學(xué)院,安徽 蚌埠 233000)
?
面向旅游突發(fā)事件的客流量混合預(yù)測(cè)方法研究
陳 榮1,梁昌勇2,陸文星2,董駿峰2,葛立新3
(1.蚌埠學(xué)院經(jīng)濟(jì)與管理學(xué)院,安徽 蚌埠 233000;2.合肥工業(yè)大學(xué)管理學(xué)院,安徽 合肥 230009;3.蚌埠學(xué)院理學(xué)院,安徽 蚌埠 233000)
由于旅游突發(fā)事件的突然爆發(fā)性、危害性及信息不對(duì)稱性,導(dǎo)致旅游客流量在短時(shí)間內(nèi)發(fā)生急劇變化,原有模式被打破,非線性趨勢(shì)和線性特征交織的隨機(jī)性趨勢(shì)明顯,為旅游客流量正常預(yù)測(cè)帶來極大的難度。本文提出一種面向旅游突發(fā)事件客流量混合預(yù)測(cè)方法,即支持向量回歸(Support Vector Regression,SVR)和自回歸求和移動(dòng)平均模型(Autoregressive Integrated Moving Average, ARIMA)結(jié)合的混合預(yù)測(cè)方法:首先通過SVR預(yù)測(cè)旅游突發(fā)事件時(shí)期客流量,然后再用ARIMA預(yù)測(cè)SVR預(yù)測(cè)值的殘差部分,最后將兩者預(yù)測(cè)結(jié)果相加;同時(shí)針對(duì)客流量復(fù)雜特征,采用一種混沌粒子群算法(Chaos Particle swarm optimization, CPSO)實(shí)現(xiàn)對(duì)SVR參數(shù)選擇。來自黃山風(fēng)景區(qū)汶川地震時(shí)期客流量相關(guān)數(shù)據(jù)驗(yàn)證表明,混合預(yù)測(cè)模型優(yōu)于單一預(yù)測(cè)方法,為旅游突發(fā)事件時(shí)期客流量預(yù)測(cè)提供了一種有效選擇。
SVR;ARIMA;CPSO;旅游突發(fā)事件;客流量預(yù)測(cè)
旅游業(yè)是一項(xiàng)對(duì)外界環(huán)境較敏感的行業(yè),一些突發(fā)的旅游事件如自然災(zāi)害(地震、海嘯、流行病等)和人為災(zāi)害(恐怖主義、政治動(dòng)蕩、戰(zhàn)爭(zhēng)等)等會(huì)對(duì)旅游行業(yè)造成極大的影響[1]。由于這些旅游突發(fā)事件通常發(fā)生突然、無法預(yù)料,社會(huì)影響大,信息不對(duì)稱,會(huì)給景區(qū)造成極大的危害。它會(huì)使人們遠(yuǎn)離旅游目的地,破壞旅游系統(tǒng)發(fā)展天然而穩(wěn)定的趨勢(shì)和時(shí)間規(guī)律,從而使得景區(qū)管理者無法預(yù)知突發(fā)事件后客流量情況,給管理決策帶來很大的不確定性。
旅游突發(fā)事件時(shí)期客流量作為旅游系統(tǒng)完整的一部分,通常被描述為“一種固有的非線性與線性相結(jié)合的復(fù)雜混沌動(dòng)態(tài)系統(tǒng)”[2]。這種不同特征的混合,使得旅游突發(fā)事件時(shí)客流量較平常日和節(jié)假日更無規(guī)律性,現(xiàn)有單一預(yù)測(cè)方法難以實(shí)現(xiàn)這種非常規(guī)客流量預(yù)測(cè)[3]。故建立準(zhǔn)確的能及時(shí)反映旅游突發(fā)事件時(shí)期客流量預(yù)測(cè)方法對(duì)旅游行業(yè)意義重大。
目前旅游突發(fā)事件客流量預(yù)測(cè)研究主要集中一些較大旅游突發(fā)事件的影響,如亞洲金融危機(jī)[4-5]、臺(tái)灣大地震[6]、SARS[7-8]、911事件[9]等,所用方法主要以ARIMA、SARIMA、ARMAX和ADLM等單一方法為主,它們?yōu)槁糜瓮话l(fā)事件預(yù)測(cè)提供了一種相對(duì)有效的工具,但是它們只關(guān)注突發(fā)事件后旅游客流量長(zhǎng)期趨勢(shì)如月、季及年等預(yù)測(cè),具體的短期的日客流量預(yù)測(cè)幾乎沒有涉及。組合預(yù)測(cè)方法[10-11]為處理線性與非線性等復(fù)雜預(yù)測(cè)提供了一種選擇,但是該類方法是不同預(yù)測(cè)方法的線性組合,預(yù)測(cè)準(zhǔn)確性受權(quán)重選取影響,目前對(duì)于權(quán)重的獲取缺乏較為成熟的方法與理論指導(dǎo),往往導(dǎo)致預(yù)測(cè)結(jié)果與實(shí)際值存在一定偏差。混合預(yù)測(cè)方法在處理非線性與線性相結(jié)合的預(yù)測(cè)問題上表現(xiàn)出良好的預(yù)測(cè)性能:將不同預(yù)測(cè)方法結(jié)合,充分利用各自方法的優(yōu)點(diǎn),它既克服單一方法技術(shù)上的弱點(diǎn),又避免了組合預(yù)測(cè)方法權(quán)重選取的局限性,從而取得較單一方法和組合方法更好的預(yù)測(cè)性能和效果,增加了模型的適應(yīng)性[12-13]。在混合預(yù)測(cè)方法中,以人工神經(jīng)網(wǎng)絡(luò)(Artificial neural network, ANN)為主的人工智能方法和以ARMA、ARIMA為基礎(chǔ)的經(jīng)典時(shí)間序列預(yù)測(cè)方法較為常用[14-16],但是由于ANN方法自身存在局部最優(yōu)及收斂速度慢等缺陷,且需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練,在現(xiàn)實(shí)中也往往難以實(shí)現(xiàn)準(zhǔn)確預(yù)測(cè)。作為一種統(tǒng)計(jì)理論方法,SVR克服ANN方法上述缺點(diǎn),具有很好的學(xué)習(xí)能力且善于捕捉到數(shù)據(jù)的非線性特征,因而在解決非線性、小樣本問題上顯示出很多獨(dú)特的優(yōu)點(diǎn),而ARIMA模型是線性模型,非常適合線性趨勢(shì)項(xiàng)的預(yù)測(cè)[17]。因此SVR與ARMA、ARIMA等結(jié)合混合預(yù)測(cè)是近年來發(fā)展起來的方法,在行業(yè)產(chǎn)值、股票價(jià)格、空調(diào)負(fù)荷、電力負(fù)荷等非線性與線性交織的復(fù)雜時(shí)間序列預(yù)測(cè)時(shí),均表現(xiàn)出良好的預(yù)測(cè)能力[18-19]。
因此針對(duì)旅游突發(fā)事件時(shí)期客流量明顯非線性與線性的特點(diǎn),本文將SVR和ARIMA混合,實(shí)現(xiàn)客流量預(yù)測(cè),同時(shí)根據(jù)突發(fā)事件客流量非線性和線性的混沌動(dòng)態(tài)等特征,用CPSO選擇SVR的自由參數(shù),將SVR、CPSO和ARIMA結(jié)合,充分利用各自的優(yōu)勢(shì)實(shí)現(xiàn)旅游突發(fā)事件時(shí)期客流量預(yù)測(cè)。以來自黃山風(fēng)景區(qū)汶川地震時(shí)期相關(guān)客流量數(shù)據(jù)進(jìn)行應(yīng)用分析,驗(yàn)證混合預(yù)測(cè)方法的有效性和準(zhǔn)確性。
2.1 SVR原理
對(duì)于非線性回歸問題,SVR的基本思想是引進(jìn)核函數(shù)k(x,x′),把問題轉(zhuǎn)化為高維空間(Hilbert空間) 中的線性回歸問題,從而構(gòu)造決策函數(shù)[20]。在高維空間里存在線性函數(shù)f,可以較好反映出輸入變量與輸出變量關(guān)系,即為所述SVR函數(shù):
f(x)=wTφ(x)+b
φ:Rn→F,w∈F
(1)
引入結(jié)構(gòu)風(fēng)險(xiǎn)函數(shù):
(2)
這里f(·)表示復(fù)雜度的項(xiàng),‖w‖2表示描述函數(shù),C為是折中模型復(fù)雜度和經(jīng)驗(yàn)風(fēng)險(xiǎn)的常數(shù)。|yi-f(xi)|是ε不敏感損失函數(shù),它用以偏差控制,讓估計(jì)更具有魯棒性。|yi-f(xi)|具體表述為:
(3)
上述函數(shù)回歸問題等價(jià)于下列最小化代價(jià)泛函:
(4)
上式中ξi*,ξi為松弛變量,目的是使(4)式的解存在。引入Lagrange函數(shù)求該優(yōu)化問題結(jié)合KKT條件,求出所需回歸函數(shù):
(5)
ai為L(zhǎng)agrange乘子,ai∈[0,C],k(xi,x)=φ(xi)φ(x)是滿足Mercer條件的核函數(shù),這里選用寬度為σ的Gaussian徑向基核函數(shù),得到最終的回歸函數(shù):
(6)
xi為訓(xùn)練年份輸入向量,x為預(yù)測(cè)年份輸入向量,b為閾值。
2.2 CPSO參數(shù)尋優(yōu)
SVR預(yù)測(cè)性能受到自由參數(shù)C、ε和σ的影響,基于突發(fā)事件時(shí)期旅游客流量特點(diǎn),本文選取CPSO實(shí)現(xiàn)對(duì)三個(gè)自由參數(shù)的尋優(yōu)。通過將混沌優(yōu)化算法中的局部搜索(Chaotic Local Search, CLS)和自適應(yīng)慣性權(quán)重因子(Adaptive Inertia Weight Factor, AIWF)引入,利用CLS局部搜索能力和AIWF的全局搜索能力,找出最優(yōu)參數(shù),克服了PSO局部搜索能力弱、局部最優(yōu)的限制,實(shí)現(xiàn)了全局搜索能力和局部搜索能力的統(tǒng)一[21]。
2.2.1 自適應(yīng)慣性權(quán)重因子(AIWF)
在PSO算法中,每個(gè)優(yōu)化問題的潛在解稱之為“粒子”。每個(gè)粒子對(duì)對(duì)應(yīng)一個(gè)由適應(yīng)度函數(shù)決定的適應(yīng)值(fitness value)。粒子i在n維空間里的位置表示為一個(gè)矢量。由于在SVR模型有3個(gè)自由參數(shù),因此,在n維狀態(tài)空間里,第i個(gè)粒子在n維空間的位置,第i個(gè)粒子的飛行速度,其搜尋到的最優(yōu)位置分別描述為[22]:
x(k)i=(x(k)i,1,x(k)i,2,…,x(k)i,n)
v(k)i=(v(k)i,1,v(k)i,2,…,v(k)i,n)
p(k)i=(p(k)i,1,p(k)i,2,…,p(k)i,n)
k=C,ε,σ,i=1,2,…,N
(7)
所有粒子x(k)=(x(k)1,x(k)2,…,x(k)N)的全局最優(yōu)解為:
p(k)g=(p(k)g,1,p(k)g,2,…,p(k)g,n)
k=C,ε,σ,i=1,2,…,N
(8)
然后每個(gè)粒子根據(jù)如下進(jìn)化公式來更新自己的速度和新位置:
v(k)i(t+1)=wv(k)i(t)+c1r1(p(k)i-
x(k)i(t))+c2r2(p(k)g-x(k)i(t))
x(k)i(t+1)=x(k)i(t)+v(k)i(t+1)
k=C,ε,σ,i=1,2,…,N
(9)
在粒子群算法中,能否有效的發(fā)現(xiàn)最優(yōu)解的關(guān)鍵在于慣性權(quán)重w。w越大,它越會(huì)促進(jìn)粒子趨向于全局搜索;當(dāng)w越小時(shí),它越會(huì)促進(jìn)粒子趨向于局部搜索。AIWF可以通過以下公式有效地調(diào)整上述PSO的權(quán)重[23]:
(10)
這里wmin-w最小值、wmax-w最大值,favg-平均適應(yīng)值、fmin-最小適應(yīng)值,f-當(dāng)前適應(yīng)值。上式可以看出,w隨著粒子適應(yīng)值改變而變化,適應(yīng)值低的粒子被保留下來,適應(yīng)值高于favg的粒子被淘汰。AIWF為保持種群多樣性、收斂能力提供了一種良好方法,保證了PSO的全局最優(yōu)性。
2.2.2 混沌局部搜索(CLS)
CLS的優(yōu)勢(shì)在于:當(dāng)粒子陷入早熟時(shí),利用CLS能使粒子跳出局部最優(yōu),從而可以快速搜索到PSO中全局最優(yōu)解fglobal best i,有效的彌補(bǔ)了PSO小范圍內(nèi)搜索能力弱的缺陷。通常情況下,CLS以Logistic方程為基礎(chǔ),具體定義如下:
(11)
(12)
(13)
(14)
具體的CPSO-SVR方法流程如圖1所示。
圖1 CPSO-SVR流程圖
2.3 ARIMA模型原理
ARIMA是在經(jīng)典時(shí)間序列預(yù)測(cè)中使用最廣泛和最靈活的一種預(yù)測(cè)模型。它的原理為:對(duì)于非平穩(wěn)的時(shí)間序列,用若干次差分(差分的次數(shù)記為d)使其成為平穩(wěn)序列,再用 ARMA(p,q)模型對(duì)該平穩(wěn)序列建模,之后經(jīng)反變換得到原序列[25]。通常情況下ARIMA模型的一般形式為ARIMA(p,d,q),模型的一般公式表示為:
yt=θ0+φ1yt-1+φ2yt-2+…+φpyt-p
εt-θ1εt-1-θ2εt-2-…-θqεt-q
(14)
步驟1 時(shí)間序列平穩(wěn)性檢驗(yàn)。平穩(wěn)性是使用ARIMA模型預(yù)測(cè)的必要條件,因此需要對(duì)時(shí)間序列的平穩(wěn)性進(jìn)行檢驗(yàn)。根據(jù)Box和Jenkins觀點(diǎn),用自相關(guān)函數(shù)(AutocorrelationFunction,ACF)、偏自相關(guān)函數(shù)(PartialAutocorrelationFunction,PACF)可以實(shí)現(xiàn)對(duì)時(shí)間序列平穩(wěn)性的識(shí)別。當(dāng)ACF快速接近于0時(shí),則該時(shí)間序列為平穩(wěn)序列;如果時(shí)間序列表現(xiàn)出一定的趨勢(shì)性和異方差,需對(duì)數(shù)據(jù)進(jìn)行差分處理和數(shù)據(jù)轉(zhuǎn)換處理,如對(duì)數(shù)轉(zhuǎn)換。
步驟2 模型識(shí)別。通過對(duì)時(shí)間序列自相關(guān)圖和偏自相關(guān)圖分析,估計(jì)p、q的值,以此為基礎(chǔ),利用AIC和SIC準(zhǔn)則確定ARIMA模型的最佳階數(shù)。
步驟3 參數(shù)估計(jì)和模型檢驗(yàn)。參數(shù)估計(jì)的目的是為了找到最合適的參數(shù)使得模型預(yù)測(cè)誤差達(dá)到最小。方法一般采用極大似然估計(jì)(MaximumLikelihoodEstimation,MLE)。同時(shí)將估計(jì)參數(shù)在模型中進(jìn)行系數(shù)顯著性、殘差序列、擬合度、AIC值和SIC值等檢驗(yàn),如果檢驗(yàn)不恰當(dāng)則重新對(duì)參數(shù)進(jìn)行估計(jì)。
步驟4模型預(yù)測(cè)。將獲得最合適參數(shù)的ARIMA進(jìn)行預(yù)測(cè)。
在上述四個(gè)步驟中,步驟1-3往往要重復(fù)幾次才能獲得滿意的模型。
2.4 基于SVR和ARIMA的混合預(yù)測(cè)方法原理
上述文獻(xiàn)中提到的混合預(yù)測(cè)模型,均先用ARIMA預(yù)測(cè),再用ANN或者SVR預(yù)測(cè)殘差。在本文里,由于突發(fā)事件客流量受多種因素影響,輸入變量為多變量,而ARIMA作為單變量模型,無法實(shí)現(xiàn)多變量的輸入。因此本文先利用SVR對(duì)突發(fā)事件客流量進(jìn)行預(yù)測(cè),然后ARIMA模型對(duì)SVR預(yù)測(cè)的殘差進(jìn)行預(yù)測(cè);最后將SVR預(yù)測(cè)值與ARIMA預(yù)測(cè)值相加即為最終預(yù)測(cè)值。具體的步驟如下:
3.1 數(shù)據(jù)來源
由于黃山是著名的山岳風(fēng)景區(qū),因此在各類旅游突發(fā)事件中,以自然災(zāi)害為主的突發(fā)事件對(duì)其影響最突出。2008年5月12號(hào),四川汶川發(fā)生地震,對(duì)當(dāng)?shù)氐穆糜钨Y源及旅游接待設(shè)施產(chǎn)生巨大的危害,黃山風(fēng)景區(qū)的客流量也受到很大的沖擊。因此本文選用黃山風(fēng)景區(qū)汶川地震前后的相關(guān)客流量數(shù)據(jù),具有一定的典型性。選用數(shù)據(jù)從2008.2.12-2008.6.30日之間數(shù)據(jù)集,包括每日客流量、每日八點(diǎn)前客流量,各140條數(shù)據(jù)。具體如圖2所示。
圖2 汶川地震前后每日客流量
從圖中可以看出,5月本是黃山風(fēng)景區(qū)旅游旺季,但是從5.12以后客流量明顯下降,持續(xù)走低,5、6月份的分月比重指數(shù)[27](即每月客流量除以全年的客流量)分別為7.62%和5.77%,遠(yuǎn)遠(yuǎn)低于2009(11.63%、7.19%)、2010(11.18%、9.38%)及2011(11.49%、6.85%)年同等月份,說明地震這種突發(fā)的自然災(zāi)難性事件對(duì)客流量造成極大的影響,原有模式被打破,非線性與線性交織的隨機(jī)性明顯。
3.2 混合預(yù)測(cè)方法實(shí)驗(yàn)過程
將2008.2.12-2008.5.12期間共計(jì)91個(gè)數(shù)據(jù)作為訓(xùn)練集,2008.5.13-2008.6.30期間共計(jì)49個(gè)數(shù)據(jù)作為測(cè)試集,它們?yōu)镾VR輸入,客流量預(yù)測(cè)值為SVR輸出,在Matlab(R2010b)試驗(yàn)平臺(tái)上按照CPSO-SVR流程反復(fù)測(cè)試。CPSO各參數(shù)設(shè)置如表1所示,其中C的范圍為[0,100],ε的范圍為[0,1],σ的范圍為[0,10]。由于在CPSO算法中,每個(gè)優(yōu)化問題的潛在解稱之為“粒子”,每個(gè)粒子對(duì)應(yīng)著SVR自由參數(shù)對(duì)(C,ε,σ),對(duì)應(yīng)參數(shù)的粒子分別稱之為C粒子、ε粒子 和σ粒子,它們最大速度vmax被分別限制在每個(gè)參數(shù)范圍15%的搜索空間內(nèi)。經(jīng)過CPSO參數(shù)尋優(yōu),最終獲得SVR模型的最優(yōu)參數(shù)值分別為:C=17.9597,σ=2.5567,ε=0.0191,CVmse=0.0050,支持向量個(gè)數(shù)為23,b=-0.5857。模型預(yù)測(cè)的最后結(jié)果及殘差如圖3所示。
表1 CPSO參數(shù)設(shè)置
圖3 汶川地震后每日客流量預(yù)測(cè)情況(5.13-6.30)
從圖可以看出,49個(gè)預(yù)測(cè)值中,殘差以負(fù)值為主:負(fù)值43個(gè),正值僅6個(gè)。說明在預(yù)測(cè)過程中預(yù)測(cè)值普遍高于實(shí)際值,可能原因在于:由于受汶川地震突發(fā)事件影響,客流量突然受到影響,而CPSO-SVR方法無法很快適應(yīng)這種突如其來數(shù)據(jù)量的變化,仍然按照其原有的軌跡進(jìn)行預(yù)測(cè),因此出現(xiàn)預(yù)測(cè)值大部分高于實(shí)際值現(xiàn)象。此時(shí)預(yù)測(cè)誤差為22.92%。顯然,這種預(yù)測(cè)誤差較大,指導(dǎo)意義不大。再通過Eviews6.0軟件,對(duì)殘差的平穩(wěn)性進(jìn)行檢驗(yàn),發(fā)現(xiàn)一階差分后數(shù)據(jù)呈現(xiàn)平穩(wěn)性,故d=1,對(duì)一階差分后殘差序列的自相關(guān)和偏相關(guān)分析(如圖4所示),進(jìn)一步確定了該模型結(jié)構(gòu)為ARIMA(1,1,1)。
圖4 殘差A(yù)CF和PACF分析
圖5 汶川地震后客流量預(yù)測(cè)值不同方法比較
圖6 不同預(yù)測(cè)方法誤差比較
3.3 實(shí)驗(yàn)結(jié)果討論
通過圖5、圖6和表2可以看出,在49天的預(yù)測(cè)值里,用SVR和ARIMA混合預(yù)測(cè)結(jié)果與實(shí)際值最接近的有33天,CPSO-SVR為13天,PSO-SVR僅3天,誤差情況SVR和ARIMA混合法最小,其次CPSO-SVR,最后為PSO-SVR。為進(jìn)一步比較預(yù)測(cè)值和實(shí)際值偏離程度,本文選用平均絕對(duì)誤差(Mean Absolute Error, MAE)、平均絕對(duì)百分誤差(Mean Absolute Percentage Error, MAPE)、均方誤差(Root Mean Square Error, RMSE)及相關(guān)系數(shù)R等作為評(píng)價(jià)指標(biāo)[28-29]。具體評(píng)價(jià)指標(biāo)如表3所示。
注:*號(hào)表明該預(yù)測(cè)值最接近實(shí)際值。
表3 不同預(yù)測(cè)方法評(píng)價(jià)指標(biāo)值
從上表可以看出, SVR和ARIMA混合預(yù)測(cè)方法MAE、MAPE及RSME均低于CPSO-SVR和PSO-SVR;相關(guān)系數(shù)R高于CPSO-SVR和PSO-SVR,進(jìn)一步說明混合預(yù)測(cè)方法效果優(yōu)于CPSO-SVR和PSO-SVR。可能的原因在于:
(1)汶川地震發(fā)生后客流量偏離以往模式,非線性和線性相結(jié)合的隨機(jī)性特點(diǎn)占主導(dǎo)地位,在SVR和ARIMA的混合預(yù)測(cè)方法中,SVR具有處理非線性的能力,ARIMA對(duì)線性趨勢(shì)有很好的預(yù)測(cè)能力,兩者結(jié)合抓住突發(fā)事件發(fā)生時(shí)客流量特點(diǎn),因此混合預(yù)測(cè)方法能力較單個(gè)的SVR預(yù)測(cè)方法得到提高。
(2)CPSO能夠根據(jù)客流量特點(diǎn)更好實(shí)現(xiàn)對(duì)SVR自由參數(shù)快速尋優(yōu),加入CPSO的混合預(yù)測(cè)方法,預(yù)測(cè)準(zhǔn)確性更好。
(3)在預(yù)測(cè)的過程中也發(fā)現(xiàn),在CPSO-SVR和PSO-SVR的比較中,前者預(yù)測(cè)能力高于后者,這充分說明了加入混沌局部搜索CLS和自適應(yīng)慣性權(quán)重因子AIWF的CPSO算法尋優(yōu)能力高于單純的PSO算法。
(4)三種方法在預(yù)測(cè)過程中,預(yù)測(cè)值普遍高于實(shí)際值(如圖6誤差表所示),可能的原因在于SVR此時(shí)的預(yù)測(cè)值為沒有發(fā)生地震時(shí)正常狀態(tài)下預(yù)測(cè)值,按照以往慣例,黃山此時(shí)是旅游旺季,但突然發(fā)生的地震破壞了客流量以往模式,因此造成預(yù)測(cè)值普遍高于實(shí)際值的現(xiàn)象。這同時(shí)也說明SVR在面臨一些轉(zhuǎn)折點(diǎn)、突發(fā)事件時(shí),不能很快適應(yīng)客流量突然的變化,預(yù)測(cè)能力受到一定挑戰(zhàn),但是可以通過和其他合適方法的混合來彌補(bǔ)SVR在預(yù)測(cè)方面存在的局限性,本節(jié)的混合預(yù)測(cè)方法正是說明了這個(gè)道理。
3.4 混合預(yù)測(cè)方法的局限性
由于國(guó)內(nèi)景區(qū)實(shí)行信息化的時(shí)間較短,旅游突發(fā)事件發(fā)生后短期客流量數(shù)據(jù)獲取有限,本文僅用汶川地震發(fā)生前后不到5個(gè)月的客流量數(shù)據(jù)對(duì)混合方法進(jìn)行訓(xùn)練、測(cè)試,給出的數(shù)據(jù)個(gè)數(shù)較少,規(guī)律表現(xiàn)的不是很明顯,如有大量歷史同等數(shù)據(jù)如2008年及以前該期間的數(shù)據(jù)輸入時(shí),模型的有效性將會(huì)得到更好的體現(xiàn);另外其他的一些較大的對(duì)旅游景區(qū)產(chǎn)生直接影響的突發(fā)事件如SRAS由于無記錄的客流量數(shù)據(jù),因此無法用該模型進(jìn)行驗(yàn)證。從某種意義上說該混合方法存在一定的局限性。但是隨著智慧景區(qū)的實(shí)施推廣,數(shù)據(jù)的收集將變得越來越容易,因此該方法將會(huì)得到更廣泛的推廣應(yīng)用。
旅游突發(fā)事件經(jīng)常會(huì)給旅游景區(qū)造成巨大的影響,其中最直接的就是客流量的劇烈波動(dòng)。這種劇烈的波動(dòng),偏離原有的客流量運(yùn)行模式,呈現(xiàn)出復(fù)雜非線性和線性相結(jié)合的隨機(jī)性特點(diǎn)。旅游突發(fā)事件時(shí)期客流量的準(zhǔn)確預(yù)測(cè)能夠使景區(qū)管理者合理配置資源,及時(shí)快速地進(jìn)行相應(yīng)的應(yīng)急管理。本文提出了一種SVR和ARIMA的混合預(yù)測(cè)方法?;贑LS和AIWF的PSO算法找出SVR最優(yōu)自由參數(shù),研究結(jié)果表明:本文提出的混合預(yù)測(cè)方法效果顯著優(yōu)于其他方法。該混合方法中涉及到的SVR和ARIMA預(yù)測(cè)方法,均在各自的應(yīng)用領(lǐng)域里應(yīng)用廣泛,因此混合使用時(shí),操作方法簡(jiǎn)單,可行性較高。該方法不僅在旅游突發(fā)事件時(shí)期對(duì)客流量具有良好的預(yù)測(cè)效果,在類似的行業(yè)領(lǐng)域內(nèi)面臨同樣狀況時(shí)也能進(jìn)行預(yù)測(cè),具有一定的推廣性和應(yīng)用價(jià)值。
[1] Wang Y S. The impact of crisis events and macroeconomic activity on Taiwan's international inbound tourism demand [J]. Tourism Management, 2009, 30(1): 75-82.
[2] Faulkner B, Russell R. Chaos and complexity in tourism: In search of a new perspective [J]. Pacific Tourism Review, 1997, 1(2): 93-102.
[3] Prideaux B, Laws E, Faulkner B. Events in Indonesia: Exploring the limits to formal tourism trends forecasting methods in complex crisis situations [J]. Tourism Management, 2003, 24(4): 475-487.
[4] Goh C, Law R. Modeling and forecasting tourism demand for arrivals with stochastic nonstationary seasonality and intervention [J]. Tourism Management, 2002, 23(5): 499-510.
[5] Law R. The impact of the Asian financial crisis on Japanese demand for travel toHong Kong: A study of various forecasting techniques[J]. Journal of Travel & Tourism Marketing, 2001, 10(2-3): 47-65.
[6] Huang J H, Min J C H. Earthquake devastation and recovery in tourism: The Taiwan case [J]. Tourism Management, 2002, 23 (2): 145-154.
[7] Min J C H. The effect of the SARS illness on tourism in Taiwan: An empirical study [J]. International Journal of Management, 2005, 22(3): 497-508.
[8] Kuo H I, Chen C C, Tseng W C, et al. Assessing impacts of SARS and Avian Flu on international tourism demand to Asia [J]. Tourism Management, 2008, 29(5): 917-928.
[9] Wang Y S. The impact of crisis events and macroeconomic activity on Taiwan's international inbound tourism demand [J]. Tourism Management, 2009, 30(1): 75-82.
[10] Fang Yue. Forecasting combination and encompassing tests [J]. International Journal of Forecasting, 2003, 19(1):87-94.
[11] Wong K K F, Song H Y, Witt S F, et al. Tourism forecasting: To combine or not to combine [J]. Tourism Management,2007,28(4):1068-1078.
[12] Shahrabi J, Hadavandi E, Asadi S. Developing a hybrid intelligent model for forecasting problems: Case study of tourism demand time series [J]. Knowledge-Based Systems, 2013, 43(2): 112-122.
[13] 張金良.電力市場(chǎng)環(huán)境下的短期電價(jià)混合預(yù)測(cè)模型研究[D].北京:華北電力大學(xué),2011.
[14] Khashei M, Bijari M. A novel hybridization of artificial neural networks and ARIMA models for time series forecasting [J]. Applied Soft Computing, 2011, 11(2): 2664-2675.
[15] Fard A K, Akbari-Zadeh M R. A hybrid method based on wavelet, ANN and ARIMA model for short-term load forecasting [J]. Journal of Experimental & Theoretical Artificial Intelligence, 2014, 26(2): 167-182.
[16] Li Xuemei, Ding Lixing, Deng Yuyan, et al. Hybrid support vector machine and ARIMA model in building cooling prediction[C].Proceedings of 2010 International Symposium on Computer Communication Control and Automation (3CA), Tainan,Taiwan,May 5-7, 2010.
[17] 王書平, 胡愛梅, 吳振信. 基于多尺度組合模型的銅價(jià)預(yù)測(cè)研究[J]. 中國(guó)管理科學(xué), 2014,22(8):21-28.
[18] Chen K Y, Wang C H. A hybrid SARIMA and support vector machines in forecasting the production values of the machinery industry in Taiwan [J]. Expert Systems with Applications, 2007, 32 (1): 254-264.
[19] Pai P F, Lin C S. A hybrid ARIMA and support vector machines model in stock price forecasting [J]. Omega, 2005, 33(6): 497-505.
[20] 姚智勝, 邵春福, 熊志華. 基于小波包和最小二乘支持向量機(jī)的短時(shí)交通流組合預(yù)測(cè)方法研究[J]. 中國(guó)管理科學(xué), 2007, 15(1): 64-68.
[21] 李炳宇,蕭蘊(yùn)詩,汪 鐳.一種求解高維復(fù)雜函數(shù)優(yōu)化問題的混合粒子群優(yōu)化算法[J].信息與控制, 2004, 33(1): 27-30.
[22] Hong W C. Chaotic particle swarm optimization algorithm in a support vector regression electric load forecasting model [J]. Energy Conversion and Management, 2009, 50(1): 105-117.
[23] Liu Bo, Wang Ling, Jin Yihui, et al. Improved particle swarm optimization combined with chaos [J]. Chaos, Solitons & Fractals, 2005, 25(5): 1261-1271.
[24] 劉軍民,高岳林.混沌粒子群優(yōu)化算法[J].計(jì)算機(jī)應(yīng)用, 2008, 28(2): 322-325.
[25] 韓超,宋蘇,王成紅.基于ARIMA 模型的短時(shí)交通流實(shí)時(shí)自適應(yīng)預(yù)測(cè)[J].系統(tǒng)仿真學(xué)報(bào), 2004, 16(7): 1530-1532.
[26] 譚滿春,馮犖斌,徐建閩.基于ARIMA 與人工神經(jīng)網(wǎng)絡(luò)組合模型的交通流預(yù)測(cè)[J].中國(guó)公路學(xué)報(bào), 2007, 20(4): 118-121.
[27] 曹偉宏,何元,李宗省,等.麗江旅游氣候舒適度與年內(nèi)客流量變化相關(guān)性分析[J].地理科學(xué), 2012, 32(12): 1459-1564.
[28] 賽英,張鳳廷,張濤.基于支持向量機(jī)的中國(guó)股指期貨回歸預(yù)測(cè)研究[J].中國(guó)管理科學(xué), 2013, 21(3): 35-39.
[29] 徐達(dá)宇,楊善林,羅賀,基于廣義模糊軟集理論的云計(jì)算資源需求組合預(yù)測(cè)研究[J].中國(guó)管理科學(xué),2015,23(5): 56-64.
The Research of Tourist Flow Hybrid Forecasting Model for Tourism Emergency Events
CHEN Rong1, LIANG Chang-yong2, LU Wen-xing2, DONG Jun-feng2,GE Li-xin3
(1.Department of Economic and Management, BengBu University, Bengbu 233000,China; 2.School of Management, HeFei University of Technology, Hefei 230009,China; 3.Department of Science, BengBu University, Bengbu 233000,China)
Because of sudden explosiveness and destructiveness as well as information asymmetry caused by tourism emergency events, the tourist flow deviates from original patterns and presents nonlinear and linear features, which causes a great difficulty to tourist flow forecasting. Traditional forecasting methods cannot solve this complicated problem. The article proposes a kind of tourist flow hybrid forecasting model for tourism emergency events which include two methods. One method is Support Vector Regression (SVR). It has good ability to deal with nonlinear and small sample problems and has been successfully used in many forecasting fields by researchers. The other method is Autoregressive Integrated Moving Average (ARIMA) which can deal with linear problem easily. At same time, the three parametersC,ε,σofSVRaffecttheaccuracyofforecast.AkindofChaosParticleSwarmOptimization(CPSO)isusedinthearticle.BythelocalsearchabilityofChaoticLocalSearch(CLS)aswellasglobalsearchabilityofAdaptiveInertiaWeightFactor(AIWF)inCPSO,theoptimalparametersC,ε,σofSVRcanbefoundeffectively.Thedetailprocessoftouristflowhybridforecastingmodelisasfollow.FirstlySVRisusedtoforecasttouristflowduringemergencies.Meanwhile,CPSOisimplementedtoselecttheSVRparameters;SecondlyARIMAmodelisprovidedtoforecastresidualsequenceofforecastingvalues.Finallytwopredictedvalueswillbeadded,whichleadstothefinalpredictedvalues.DatasetfromMountHuangshanduringWenchuanEarthquakesperiodareusedtovalidatetheeffectivenessofthehybridmodels.ThenumberofthedataisfromFebruary12, 2008toJune12, 2008,includingthedailytouristflowanddailytouristflowbeforeeighto'clock.TheresultsshowthatthehybridapproachesaresignificantlyhigherinaccuracythanCPSO-SVRandPSO-SVR.,whichprovideaneffectivechoicetotourismemergencyeventsflowforecastingaswellassimilarindustriesfacingthesamesituation.Nextresearcheswillfocusontouristflowforecastingunderthebackgroundofbigdata.
SVR;ARIMA;CPSO;tourism emergeney everts;tourist floco forecasting
1003-207(2017)05-0167-08
10.16381/j.cnki.issn1003-207x.2017.05.020
2016-01-07;
2016-04-27
國(guó)家自然科學(xué)基金資助項(xiàng)目(71331002, 71271072, 71301037, 71301040);安徽高校自然科學(xué)研究重點(diǎn)項(xiàng)目(KJ2015A143);安徽省教育廳2016年高校優(yōu)秀拔尖人才培育資助重點(diǎn)項(xiàng)目(gxfxZD2016283);蚌埠學(xué)院國(guó)家級(jí)項(xiàng)目培育基金項(xiàng)目
梁昌勇(1965-),男(漢族),安徽肥西人,合肥工業(yè)大學(xué)管理學(xué)院教授,博士生導(dǎo)師,研究方向:管理信息系統(tǒng)、行為決策、信息管理與公共政策、云計(jì)算技術(shù)等,E-mail: cyliang@hfut.edu.cn.
TP181
A