梁宗經(jīng),曠 蕓
(1.廣西師范大學(xué)計算機科學(xué)與信息工程學(xué)院,廣西桂林541004;2.桂林師范高等??茖W(xué)校,廣西桂林541001)
旅游產(chǎn)業(yè)作為無煙工業(yè),近幾十年來,旅游產(chǎn)業(yè)持續(xù)快速發(fā)展。根據(jù)世界旅游權(quán)威機構(gòu)預(yù)測,未來的旅游產(chǎn)業(yè)將成為世界第一大產(chǎn)業(yè)[1]。基于旅游產(chǎn)業(yè)在國民經(jīng)濟中的重要作用,研究產(chǎn)業(yè)的未來發(fā)展趨勢、正確預(yù)測產(chǎn)業(yè)發(fā)展方向等問題,具有重要的現(xiàn)實意義。旅游需求是所有與旅游管理決策相關(guān)的基礎(chǔ),而旅游入境數(shù)則是最常用于指代旅游需求的指標(biāo),旅游入境數(shù)預(yù)測長期以來已成為旅游需求預(yù)測的熱點問題[2]。
目前,國內(nèi)外旅游入境數(shù)預(yù)測方法主要是采用定量研究方法,國內(nèi)研究方法之一是采用傳統(tǒng)的統(tǒng)計學(xué)模型,比如通過引入新的變量構(gòu)建旅游目的地理論模型、應(yīng)用回歸方法預(yù)測旅游目的地游客數(shù)[3],應(yīng)用時間序列模型SARIMA、采用年度統(tǒng)計數(shù)據(jù)進行省級國際旅游需求預(yù)測[4],采用ARFIMA模型進行我國旅游入境數(shù)預(yù)測[5]等;研究方法之二是應(yīng)用人工智能理論[6-7],已有的研究成果包括:結(jié)合BP神經(jīng)網(wǎng)絡(luò)和ARIMA建立組合模型,預(yù)測中國入境旅游數(shù)[8],應(yīng)用支持向量機理論預(yù)測旅游入境數(shù),并與其它預(yù)測模型相比較,證明支持向量機模型是一種針對預(yù)測樣本容量少、不確定因素多的旅游預(yù)測有效方法之一[9]。自2000年以來,國外研究在繼續(xù)應(yīng)用傳統(tǒng)統(tǒng)計模型進行旅游需求預(yù)測的同時,許多新的技術(shù)及方法也應(yīng)用到旅游預(yù)測中,其中就包括許多非線性理論模型,如神經(jīng)網(wǎng)絡(luò)、遺傳算法、粗糙集理論、支持向量機等,通過對現(xiàn)有國外研究成果的分析,可以發(fā)現(xiàn)當(dāng)前旅游預(yù)測的發(fā)展趨勢是側(cè)重現(xiàn)有模型的組合,從而適應(yīng)當(dāng)前旅游經(jīng)濟的發(fā)展多樣性、提高預(yù)測精度[10]。
當(dāng)前國內(nèi)外旅游預(yù)測模型所用數(shù)據(jù)均是應(yīng)用年度國家或省(州)官方統(tǒng)計數(shù)據(jù),而統(tǒng)計年鑒數(shù)據(jù)均存在滯后性,不能實現(xiàn)實時預(yù)測,而信息技術(shù)高度發(fā)展的今天,互聯(lián)網(wǎng)的應(yīng)用已廣泛應(yīng)用于各行業(yè),旅游行業(yè)是互聯(lián)網(wǎng)應(yīng)用最廣泛、最有效的行業(yè)之一,現(xiàn)在互聯(lián)網(wǎng)已被應(yīng)用到旅游產(chǎn)業(yè)的各個環(huán)節(jié),隨著在線旅游信息的大量增加,搜索引擎已經(jīng)成為了發(fā)現(xiàn)旅游相關(guān)信息及旅游規(guī)劃的主要工具,通過搜索引擎,旅游管理者、從業(yè)人員能夠發(fā)現(xiàn)潛在的旅游者[11]。搜索引擎查詢數(shù)據(jù)包含了豐富的用戶信息,并且這些數(shù)據(jù)是實時數(shù)據(jù),為實時預(yù)測提供了寶貴的原始數(shù)據(jù),搜索引擎指數(shù)可用于短期實時預(yù)測[12],應(yīng)用搜索引擎指數(shù)能夠?qū)崿F(xiàn)相關(guān)性指標(biāo)的實時預(yù)測,克服傳統(tǒng)預(yù)測模型采用年度、月度統(tǒng)計數(shù)據(jù)所具有滯后性的不足,從而實現(xiàn)實時預(yù)測。與此同時,應(yīng)用搜索引擎指數(shù)進行相關(guān)性研究,可將搜索指數(shù)作為新的經(jīng)濟變量納入預(yù)測模型,主要基于以下理由:(1)互聯(lián)網(wǎng)的廣泛應(yīng)用為本研究提供了可能。當(dāng)前世界上應(yīng)用最廣泛的搜索引擎為google搜索引擎,其為英文搜索,同時它也可以進行中文或其它語言的搜索,但主要搜索語言是英文,其次則是中文的搜索引擎百度搜索,百度搜索為純中文搜索,以其特有的中文特征,成為華人地區(qū)的主要搜索引擎工具,此外,還有其它的搜索引擎,但因用戶量少、市場占有率低,在全球搜索引擎市場中影響較少。google公司免費提供用戶的搜索歷史數(shù)據(jù),這些海量數(shù)據(jù)為挖掘用戶特征提供了第一手的原始數(shù)據(jù),同樣也為預(yù)測旅游入境數(shù)創(chuàng)造了實時跟蹤的可能。(2)通過搜索引擎數(shù)據(jù)進行實時預(yù)測旅游需求,對于中國旅游業(yè)具有重要的現(xiàn)實意義。因為中國作為世界主要旅游目的地之一,以其豐富的自然資源與人文資源,實現(xiàn)實時預(yù)測將有助于旅游業(yè)的快速、健康發(fā)展。最早應(yīng)用搜索指數(shù)進行預(yù)測應(yīng)用的研究成果源于2008年發(fā)表于世界著名學(xué)術(shù)雜志《Nature》的一篇論文“Detecting influenza epidemics using search engine query data”,該論文首次開展google搜索指數(shù)與世界流感流行量的相關(guān)性研究,研究結(jié)果表明,搜索引擎指數(shù)能夠?qū)崿F(xiàn)實時監(jiān)測[13]。自此以后,搜索指數(shù)已成功應(yīng)用于流行疾病預(yù)測[14-15]、宏觀經(jīng)濟指標(biāo)預(yù)測[16-17]、商業(yè)周期預(yù)測[18]等。
綜合國內(nèi)外研究現(xiàn)狀,目前應(yīng)用搜索指數(shù)進行相關(guān)性研究主要集中于流行病預(yù)測、房地產(chǎn)研究、商品零售等,少有應(yīng)用于旅游需求的研究報道,本文擬以美國入境中國香港地區(qū)的旅游入境數(shù)作為研究對象,通過構(gòu)建自回歸分布滯后模型,引入搜索引擎指數(shù)及其滯后變量,建立入境數(shù)預(yù)測模型進行實證預(yù)測分析。下面分三部分研究:理論簡介,實證分析及結(jié)論。
搜索指數(shù)是由搜索引擎公司提供,該數(shù)據(jù)是根據(jù)特定搜索關(guān)鍵詞的全球搜索量計算后得出。當(dāng)前主要搜索指數(shù)為谷歌公司的搜索指數(shù),又名Google trend。google trend是google公司推出的用于監(jiān)測某關(guān)鍵詞或某領(lǐng)域用戶搜索的變化趨勢指數(shù),也稱為google指數(shù),數(shù)據(jù)源于全球范圍的google用戶,根據(jù)google公司提供的相關(guān)信息,google trend使用圖表顯示,橫坐標(biāo)為時間,縱坐標(biāo)為google指數(shù),圖表上的數(shù)字表示在過去的某一時間跨度、某區(qū)域(國家、州、市)某個關(guān)鍵詞的搜索歷史記錄,因原始數(shù)據(jù)已經(jīng)過歸一化處理,顯示在縱坐標(biāo)上的數(shù)字不是絕對搜索數(shù),而是相對數(shù)字,即某時間跨度內(nèi)對某個特定術(shù)語搜索數(shù)除以google的搜索總數(shù),在數(shù)值表示上則定義為特定時間內(nèi)最大搜索指數(shù)定義為100,而被查詢的初始日期搜索指數(shù)定義為0[12]。自2004年以來,google公司還提供了眾多的預(yù)定義搜索分類,分別為住房價格、旅游、電子產(chǎn)品等,該分類是指不需要用戶輸入搜索關(guān)鍵詞,只需在google trend輸入界面選擇相關(guān)分類,即可得出相關(guān)的google指數(shù)值。
統(tǒng)計學(xué)分析方法一般為普通回歸分析、單變量滯后模型、向量自回歸和誤差修正模型等,這些模型的應(yīng)用都存在著諸多使用前提條件,比如,普通回歸的應(yīng)用前提是要求變量序列必須為平穩(wěn)序列,單變量滯后模型只能分析單個變量滯后項對被解釋變量的影響,而向量自回歸與誤差修正模型則與變量的排列次序緊密相關(guān),次序不同計量結(jié)論也不同,從而影響了解釋的不確實性,同時為了更好地了解大眾關(guān)注與價格變動的關(guān)聯(lián)性,需要同時考察二者的長期均衡關(guān)系,即變量間的協(xié)整關(guān)系,傳統(tǒng)的協(xié)整關(guān)系分析,需要變量間為同階單整,對于不是同價單整的變量協(xié)整關(guān)系則必須應(yīng)用自回歸分布滯后模型(即ARDL模型)[19],ARDL模型可以分析不同價穩(wěn)定變量的協(xié)整關(guān)系,但它的應(yīng)用條件是變量可以是0階或1階穩(wěn)定序列。在本文研究所使用的變量中,因變量數(shù)據(jù)序列不是同時一階穩(wěn)定序列,部分是穩(wěn)定時間序列,部分變量數(shù)據(jù)時間序列為一階穩(wěn)定序列。因此,符合ARDL模型應(yīng)用條件。基于此,在考慮數(shù)據(jù)序列的平穩(wěn)性檢驗及增加計算結(jié)果的確定性前提上,本研究采用自回歸分布滯后模型進行預(yù)測研究。
自回歸分布滯后模型是一種計算變量間長期協(xié)整關(guān)系的定量分析方法,它能夠避免傳統(tǒng)協(xié)整關(guān)系檢驗需要同階單整的前提條件,并能自動判定變量的滯后階數(shù),充分體現(xiàn)其性能的優(yōu)越性。ARDL模型具有以下優(yōu)點:(1)ARDL邊界協(xié)整檢驗可有效應(yīng)用于有限或少樣本數(shù)據(jù)序列;(2)一旦確定滯后階數(shù),就可以應(yīng)用ARDL進行邊界檢驗的OLS回歸分析;(3)無論數(shù)據(jù)序列是一價單整還是0價單整均可以采用ARDL進行協(xié)整分析;(4)應(yīng)用ARDL模型能夠確定回歸結(jié)果的明確影響變量;(5)除可以進行長期協(xié)整分析外,還可以進行短期相關(guān)性分析。
根據(jù)ARDL的建模要求,具體步驟是首先進行數(shù)據(jù)序列的穩(wěn)定性檢驗。一般采用ADF檢驗。其次,進行邊界檢驗,最后分析長期協(xié)整關(guān)系及短期波動分析。二變量的ARDL的模型一般形式如公式所示[19-21]:
其中,公式(1)為雙變量ADRL一般形式,公式(2)為長期協(xié)整關(guān)系公式。公式中的t表示時間,本文所用數(shù)據(jù)為月度數(shù)據(jù),Yt表示入境數(shù),Xt表示搜索指數(shù),Yt-I、Yt-j和 Xt-I、Xt-j分別表示 Y 和X 的滯后 i期和 j期,a10、a20、a30為常數(shù)項,εt為誤差項,p和q表示滯后價數(shù),ln和△表示取對數(shù)和差分。
ARDL模型參數(shù)估計步驟:(1)平穩(wěn)階數(shù)檢測。ARDL(m,n)模型要求建模數(shù)據(jù)序列必須為 0階單整或1階單整,但不要求同時同階穩(wěn)定。(2)模型參數(shù)估計。模型參數(shù)確定關(guān)鍵是二變量的滯后創(chuàng)數(shù)確定,滯后階數(shù)根據(jù)計算結(jié)果的Akaike Information Criteria值決定,取該數(shù)值最小的模型滯后階數(shù)。(3)邊界檢測。計算模型的F統(tǒng)計量,并與相應(yīng)的誤差數(shù)值表相對照,從而判斷模型是否成立。(4)穩(wěn)定性檢驗。進行(CUSUM)and the CUSUM of square(CUSUMSQ)檢測[22],繪制模型的CUSUM CUSUM of Squares圖形,并根據(jù)圖形決斷模型的穩(wěn)定性精度。(5)建立長期協(xié)整關(guān)系方程。采用已通過所有檢驗的ARDL模型進行預(yù)測分析,并分析預(yù)測結(jié)果。ARDL模型的協(xié)整檢驗主要是通過模型估計的F統(tǒng)計量作為檢驗標(biāo)準(zhǔn),如果F統(tǒng)計量設(shè)定誤差范圍的邊界值以內(nèi),則說明變量間存在長期協(xié)整關(guān)系,反之,則不存在長期協(xié)整關(guān)系。根據(jù)ARDL模型的理論要求,不同的變量數(shù)、不同單整階數(shù)、不同的誤差設(shè)定,均對不同的F參考值,實證應(yīng)用只需要將計算結(jié)果的F統(tǒng)計量與相對的邊界值相比較就可判斷其協(xié)整性。
預(yù)測精度評測選用三個指標(biāo):MAE、MAPE和RMSE,其中MAE(平均絕對誤差):MAE通過計算預(yù)測值與真實值的絕對誤差,并進行平均所得的誤差估計指標(biāo),MAE的值越小,誤差就越小,表示預(yù)測值與真實值的重合度越高。MAPE(平均絕對百分比誤差),一般情況認為MAPE值小于10,則說明預(yù)測精度高,RMSE則是均方根誤差。計算公式如下所示:
本文選取美國至香港旅游入境人數(shù)作為研究對象,結(jié)合搜索指數(shù)研究入境數(shù)與搜索指數(shù)之間的關(guān)聯(lián)性。選擇香港作為旅游目的地的原因:(1)歷史上很長時間里香港是中國與外國聯(lián)系的主要聯(lián)系港口,香港經(jīng)濟與內(nèi)地經(jīng)濟緊密相聯(lián);(2)香港具有悠久的歷史、文化底蘊以及豐富的旅游資源;(3)旅游業(yè)在香港占據(jù)重要的經(jīng)濟地位,旅游業(yè)貢獻了香港GDP的5%、旅游從業(yè)人員占總就業(yè)的7.2%[23]。因此,研究以香港作為旅游目的地具有重要的現(xiàn)實意義。而以美國入境香港旅游人數(shù)作為分析數(shù)據(jù),原因主要有:(1)根據(jù)香港旅游局的統(tǒng)計數(shù)據(jù)表明,美國為香港主要境外主要來源國之一;(2)英語為美國主要使用語言,谷歌公司為美國公司,在地區(qū)搜索中美國地區(qū)的谷歌指數(shù)數(shù)據(jù)是最為詳細及完整,這有助于提高數(shù)據(jù)有效性。基于上述原因,本文以入境香港的美國人數(shù)、美國全境范圍內(nèi)針對香港的搜索指數(shù)作為研究對象,通過實證分析,研究實際旅游入境數(shù)與搜索指數(shù)的相關(guān)性,經(jīng)過建模檢驗并預(yù)測,探討搜索指數(shù)對實際旅游入境數(shù)的影響程度。
研究數(shù)據(jù)包括入境數(shù)據(jù)和搜索數(shù)據(jù),其中入境數(shù)據(jù)取自香港旅游發(fā)展局公布的旅游統(tǒng)計數(shù)據(jù)( 網(wǎng) 址 :https://www.discoverhongkong.com/cn-index.jsp),入境數(shù)據(jù)為月度數(shù)據(jù),取值范圍為2004年1月至2015年12月。搜索數(shù)據(jù)來源于谷歌趨勢網(wǎng)站(網(wǎng)址:www.google.ca/google trends),因為谷歌指數(shù)界面除了設(shè)置用戶搜索地外,還設(shè)置有搜索領(lǐng)域,其中就包括與旅游有關(guān)的子目錄,本文選擇其中的航空、景點和天氣三個子目錄的搜索數(shù)據(jù),在本文中相應(yīng)搜索指數(shù)分別以“flight”、“spot”和“weather”表示,搜索指數(shù)取值范圍:2004年1月至2015年12月,數(shù)據(jù)類型為月度數(shù)據(jù)(自2017年1月1日起谷歌公司提供的搜索指數(shù)數(shù)據(jù)類型為月度數(shù)據(jù),而之前提供的是星期數(shù)據(jù))。下面的圖1和圖2分別為入境數(shù)據(jù)與搜索指數(shù);表1和表2分別為原始數(shù)據(jù)統(tǒng)計描述及ADF平穩(wěn)性檢驗表。
圖1 2004年1月至2015年12月美國入境中國香港游客數(shù)折線圖
圖2 2004年1月4日至2015年12月21日搜索指數(shù)(搜索地區(qū)為美國)折線圖
表1 原始數(shù)據(jù)統(tǒng)計描述(2004年1月至2015年12月)
表2 ADF單位根檢驗表
從表2可以看出,入境人數(shù)(visitor)、天氣搜索指數(shù)(weather)為平穩(wěn)序列,即 0階單整(即 I(0)),景點搜索指數(shù)(spot) 和航班搜索指數(shù)(flight)原始數(shù)列為不平穩(wěn)時間序列,但它們的一階差分序列為平穩(wěn)序列,即1階單整(即I(1)),因此時間序列數(shù)據(jù)符合ARDL的建模要求。
為了便于對比納入搜索指數(shù)與否對預(yù)測精度的影響,本文分析采用ARMA與ARDL模型分別建模進行預(yù)測比較。其中建模數(shù)據(jù)的取值范圍為時間:2004年1月至2014年12月,預(yù)測數(shù)據(jù)的取值范圍為時間:2015年1月至2015年12月。
1.ARMA(p,q)模型。ARMA為自回歸移動平均模型,ARMA模型的估計原理主要是使用時間序列數(shù)據(jù)的隨機特性來描述其變化規(guī)律,即利用數(shù)據(jù)的過去值、當(dāng)前值和隨機滯后擾動項來建模估計,從而預(yù)測數(shù)據(jù)的未來值。經(jīng)實際估算,ARMA(p,q)模型首先進行數(shù)列的穩(wěn)定性檢測,從表2中看出入境數(shù)列為平穩(wěn)數(shù)列,符合ARMA(p,q)建模要求,第二步為模型識別,通過嘗試不同的p,q值,通過比較不同的自相關(guān)系數(shù)(AC)和偏自相關(guān)系數(shù)(PAC)圖,最后確定 ARMA(p,q)模型為ARMA(5,3),本文將此模型定義為模型 1。估計結(jié)果如表3所示。
表3 ARMA(5,3)模型估計結(jié)果
從估計結(jié)果可見,經(jīng)過確定模型形式后,經(jīng)過回歸分析得出,模型的擬合度為R2=0.540105,調(diào)整R2=0.506178,F(xiàn) 統(tǒng)計量 =15.91977,Prob(F-statistic)=0.000000,這說明所建模型在統(tǒng)計意義上顯著,且具有較好的擬合精度。接著進行預(yù)測分析,預(yù)測時間范圍為2015年1月至2015年12月。預(yù)測數(shù)值及誤差指標(biāo)值如表7、表8所示,預(yù)測的三個誤差指標(biāo)值分別為MAE=0.094920、MAPE=0.825103、RMSE=0.111445。
2.ARDL模型。為了比較不同搜索關(guān)鍵詞的預(yù)測精度,本文分別采集了關(guān)鍵詞分別為“weather(即天氣)”、“flight(航班)”和“spot(景點)”的搜索指數(shù)。下面分三組搜索指數(shù)進行ARDL模型估計,分別定義為模型2、模型3和模型4。根據(jù)ARDL模型的建模要求,分別進行系數(shù)估計、邊界檢測。
(1)系數(shù)估計。表4中,LNVI、LNWE、LNFL和LNSP分別表示入境數(shù)、天氣搜索指數(shù)、航班搜索指數(shù)和景點搜索指數(shù),表中括號內(nèi)的數(shù)值表示滯后除數(shù)。從表4可以得出如下結(jié)論:①確定ARDL(p,q)模型的具體形式。ARDL模型p,q參數(shù)的確定采用SBC準(zhǔn)則進行選擇,計算結(jié)果分別為:模型 2 為 ARDL(12,0),模型 3 為 ARDL(12,0),模型4為ARDL(12,3);②模型似合度比較。三個模型的擬合參數(shù)(即R2)分別為0.789、0.788和0.54,其中模型2的擬合程度最高,模型3次之,模型4最低;③系數(shù)符號解釋。三個模型的因變量(即lnvi)均受其前期數(shù)值影響,但影響程度存在差異,模型2中的自變量(即LNWE)天氣搜索量系數(shù)為-0.07,并且1%誤差范圍內(nèi)在統(tǒng)計意義上顯著,表示天氣搜索量每變化一個單位,入境數(shù)即減少7%,即天氣搜索量與入境數(shù)存在反向相關(guān)關(guān)系,表示游客對天氣尤其關(guān)注,天氣狀況左右了游客的出境旅游;模型3的自變量(即LNFL)航空信息搜索量系數(shù)為0.12,并且1%誤差范圍內(nèi)在統(tǒng)計意義上顯著,表示航班信息搜索量每變化一個單位,入境數(shù)增加12%,即航班信息搜索量與入境數(shù)存在正向相關(guān)關(guān)系,表示游客對航班信息關(guān)注,充足的航班信息有助于游客出境旅游;模型4的自變量(即LNSP)旅游目的地景點搜索量系數(shù)為0.02,雖然該系數(shù)在5%誤差的統(tǒng)計意義上不顯著,但其滯后二階變量 LNSP(-2)系數(shù)為0.11,在5%誤差統(tǒng)計意義上顯著,該結(jié)果說明,對于旅游目的地景點搜索量與入境數(shù)存在正向相關(guān)關(guān)系,表示游客對景點信息的關(guān)注有助于提高游客出境旅游的意愿。
表4 ARDL模型計量結(jié)果表
(2)邊界檢驗。根據(jù)ARDL模型理論,表4中的模型估計必須是在因果變量存在協(xié)整關(guān)系的前提下得到,因此必須檢驗自變量之量是否存在協(xié)整關(guān)系。ARDL模型理論的協(xié)整關(guān)系是通過F統(tǒng)計量進行判斷,經(jīng)計數(shù)模型2至4的F邊界檢驗結(jié)果如表5所示。
表5 F邊界檢驗表
表5為模型F統(tǒng)計量計算結(jié)果,從表中可以看出三個模型的共同特點是K值為1,即表示三個模型均為1階單整(即I(1))。模型2的F統(tǒng)計量為 4.317 810,比較 I(1)各概率誤差值可以發(fā)現(xiàn),模型5在5%顯著性水平下存在協(xié)整關(guān)系,以此類推,模型3在10%顯著性水平存在協(xié)整關(guān)系,模型4在10%顯著性水平存在協(xié)整關(guān)系。因此,可以認為變量之間存在協(xié)整關(guān)系,同時也說明表4模型系數(shù)估計在統(tǒng)計意義上成立。
(3)協(xié)整檢驗。為了檢驗變量間的長期協(xié)整關(guān)系,在已證明變量間存在協(xié)整關(guān)系的基礎(chǔ)上,需要進行模型的長期變量系數(shù)求解,根據(jù)計算長期系數(shù)為表6所示。
表6 長期協(xié)整關(guān)系系數(shù)估計表
從表6的長期系數(shù)表可以看出,模型2至模型4,各自變量系數(shù)與同期短期系數(shù)(見表4)具有相同的反饋作用,即對于模型2,游客對于天氣的關(guān)注度與入境數(shù)成反比關(guān)系,即系數(shù)為負,而對于航班及景點的關(guān)注度則與入境數(shù)成正比關(guān)系,即相關(guān)系數(shù)為正。
(4)穩(wěn)定檢驗。為了檢驗上述模型的穩(wěn)定性,需要進行CUSUM、CSUMSQ檢驗[24],即遞歸殘差和遞歸殘差和平方檢驗,檢驗結(jié)果如圖3所示,其中紅色虛線為5%誤差范圍,藍色線為殘差值。從圖3可以看出,除入境數(shù)(lnvisitor)與天氣搜索量(lnweather)的CUSM檢驗在2007年2月的殘差值超過5%誤差外,其它模型系數(shù)均通過了CUSUM、CSUMSQ檢驗。因此,可以認為所建ARDL模型成立,可以用于實際數(shù)據(jù)的預(yù)測分析。
圖3 CUSUM、CSUMSQ(即遞歸殘差和遞歸殘差和平方)檢驗圖
經(jīng)過上述對四個模型(ARMA和三個不同搜索指數(shù)的ARDL模型)、以用2015年1月至2015年12月的數(shù)據(jù)進行樣本外預(yù)測,得到的預(yù)測值與實際值的對比表如表7所示,相應(yīng)的誤差指標(biāo)值如表8所示。
表7 模型預(yù)測表
誤差指標(biāo)分別采用平均絕對誤差(MAE)、平均絕對百分比誤差(MAPE)、均方根誤差(RMSE),從表8可以看出,ARDL模型的誤差指標(biāo)值均小于ARMA模型,說明搜索指數(shù)是影響美國游客入境香港的原因之一,與此同時,發(fā)現(xiàn)預(yù)測誤差最小的是基于天氣搜索指數(shù)的ARDL模型(即模型2),該模型的三個誤差值分別為0.064 128、0.556 066、0.084 777,均為四個模型中最小的,預(yù)測模型效果從好到差依次為模型2、模型3、模型4和模型1。
表8 模型預(yù)測精度指標(biāo)值
本文構(gòu)建基于搜索指數(shù)的計量經(jīng)濟模型預(yù)測旅游需求。研究對象為美國入境香港旅游入境數(shù),研究時間范圍為2004年1月至2015年12月,數(shù)據(jù)類型為月度時間序列數(shù)據(jù),采用的計量模型為自回歸分布滯后模型(ARDL模型),為便于比較不同模型的預(yù)測精度,分別采用不包含搜索指數(shù)的ARMA模型(自回歸移動平均模型)和包含搜索指數(shù)的ARDL模型(自回歸分布滯后模型),而為了進一步了解不同搜索關(guān)鍵詞對應(yīng)的搜索指數(shù)對入境預(yù)測的差異,本文還選取了與旅游目的地緊密相關(guān)的三個不同關(guān)鍵詞,并提取相應(yīng)搜索指數(shù)數(shù)據(jù)。
實證結(jié)果表明:(1)搜索指數(shù)與入境人數(shù)存在長期協(xié)整關(guān)系。從經(jīng)典時間序列理論可知,變量間的回歸分析必須建立在同階單整的基礎(chǔ)上,如果不是同階單整,則不可進行回歸分析,但協(xié)整理論則可以解釋不同階單整變量間的數(shù)量關(guān)系。本文應(yīng)用自回歸分布滯后模型(即ARDL模型)分析旅游搜索指數(shù)與入境人數(shù)之間的數(shù)量關(guān)系,通過邊界檢驗可知,在誤差5%或10%范圍內(nèi)它們之間存在長期穩(wěn)定的協(xié)整關(guān)系。(2)搜索指數(shù)與旅游需求存在相關(guān)性。實證結(jié)果顯示,無論是短期還是長期范圍內(nèi),搜索指數(shù)與入境數(shù)均存在相關(guān)性,通過構(gòu)建四個預(yù)測模型驗證了其定量關(guān)系,其中,包含搜索指數(shù)的ARDL模型預(yù)測精度均優(yōu)于不包含搜索指數(shù)的自回歸移動平均模型(即ARMA模型),而三個ARDL模型中,基于搜索關(guān)鍵詞“天氣”(即weather)的ARDL模型預(yù)測精度最高,其次為基于搜索關(guān)鍵詞“航班”(即 flight)的ARDL模型,最后基于搜索關(guān)鍵詞“景點”(即spot)為ARDL模型中預(yù)測精度最低。在旅游管理及決策的實際應(yīng)用中,可以根據(jù)上述研究成果提出針對性的營銷策略或管理辦法。
旅游需求影響因素很多,除了與天氣狀況、旅游信息、旅游目的地景點吸引力、個人愛好等微觀因素相關(guān)外,還與旅游來源國與目的地的匯率、來源國國民生產(chǎn)總值、來源國個人可支配收入等宏觀經(jīng)濟狀況有關(guān),本文只是考慮了微觀因素,沒有納入宏觀經(jīng)濟變量,下一步的工作將結(jié)合宏觀經(jīng)濟變量進行綜合分析,以期更全面地了解影響旅游需求的影響因素。
【參考文獻】
[1]第十屆世界旅游旅行大會大盤點[EB/OL].[2017-07-01].http://www.bjta.gov.cn/tsfwzt/wttc/wttctbgz/wttcymlm/342201.htm.
[2]Song H,Witt SF.Forecasting international tourist flows to Macau[J].Tourism Management,2006,27(2):214-224.
[3]楊春宇,黃震方,毛衛(wèi)東,2008.基于旅游學(xué)角度的游客量預(yù)測模型構(gòu)建及其實證研究[J].生態(tài)經(jīng)濟(4):124-127,132.
[4]張娜,佟連軍,2012.基于SARIMA模型的黑龍江省冰雪旅游國際需求預(yù)測[J].資源開發(fā)與市場(7):660-663.
[5]翁鋼民,鄭竹葉,劉洋,2009.我國入境旅游預(yù)測:基于ARFIMA模型的研究[J].商業(yè)研究(6):1-4.
[6]紀成君,何建軍,2010.國內(nèi)旅游收入預(yù)測模型的比較[J].遼寧工程技術(shù)大學(xué)學(xué)報(自然科學(xué)版)(5):990-993.
[7]楊立勛,殷書爐,2008.人工智能方法在旅游預(yù)測中的應(yīng)用及評析[J].旅游學(xué)刊(9):17-22.
[8]雷可為,陳瑛,2007.基于BP神經(jīng)網(wǎng)絡(luò)和ARIMA組合模型的中國入境游客量預(yù)測[J].旅游學(xué)刊(4):20-25.
[9]李志龍,陳志鋼,覃智勇,2010.基于支持向量機旅游需求預(yù)測[J].經(jīng)濟地理(12):2122-2126.
[10]Song H,Li G.Tourism demand modelling and forecasting-A review of recent research[J].Tourism Management.2008,29(2):203-220.
[11]Pan B,Litvin S,Goldman H.Real users,real trips,and real queries:an analysis of destination search on a search engine.In:Annual Conference ofTravel and TourismResearch Association(TTRA2006),Dublin,Ireland;2006;2006.
[12]Choi H,Varian H.Predicting the present with google trends[J].Economic Record.2012,88(s1):2-9.
[13]Ginsberg J,Mohebbi MH,Patel RS et al.Detecting influenza epidemics using search engine query data[J].Nature,2008,457(7232):1012-1014.
[14]Cook S,Conrad C,F(xiàn)owlkes AL et al.Assessing Google Flu Trends Performance in the United States during the 2009 Influenza Virus A(H1N1)Pandemic[J].PLoS ONE,2011,6(8):e23610.
[15]Ortiz JR,Zhou H,Shay DK et al.Monitoring Influenza Activity in the United States:A Comparison of Traditional Surveillance Systems with Google Flu Trends[J].PLoS ONE.2011,6(4):e18687.
[16]Zhou RX,Wang XL,Tong GQ.Forecasting macroeconomy based on the term structure of credit spreads:evidence from China[J].Applied Economics Letters,2013,20(15):1363-1367.
[17]Wu L,Brynjolfsson E.The future of prediction:How Google searches foreshadow housing prices and sales[D].Economics of Digitization.University of Chicago Press.2009.
[18]Iselin D,Siliverstovs B.Using Newspapers for Tracking the Business Cycle:A Comparative Study for Germany and Switzerland[J].KOF Swiss Economic Institute Working Paper,2013,(337).
[19]Pesaran MH,Shin Y,Smith RJ.Bounds testing approaches to the analysis of level relationships[J].Journal of applied econometrics,2001,16(3):289-326.
[20]Jalil A,Mahmood T,Idrees M.Tourism-growth nexus in Pakistan:Evidence from ARDL bounds tests[J].Economic Modelling,2013,35:185-191.
[21]Ozturk I,Acaravci A.Electricity consumption and real GDP causality nexus:Evidence from ARDL bounds testing approach for 11 MENA countries[J].Applied Energy,2011,88(8):2885-2892.
[22]Trivedi P,Behera SR.The Macroeconomic Determinants Gold Prices in India:An ARDL Approach[J].Journal of International Economics(0976-0792),2012,3(2).
[23]GovHK.AboutHK.Retrieved from GovHK:http://www.gov.hk/en/about/abouthk/factsheets/docs/tourism.pdf[J].2017.
[24]Pahlavani M,Rahimi M.Sources of Inflation in Iran:An application of the ARDL Approach[J].International Journal of Applied Econometrics&Quantitative Studies,2009,9(5):325-326.