張斌儒,王 浩,張超鋒,胡 蓉
(四川文理學(xué)院數(shù)學(xué)與財(cái)經(jīng)學(xué)院,四川達(dá)州635000)
?
①基于網(wǎng)絡(luò)搜索數(shù)據(jù)的旅游需求預(yù)測(cè)研究進(jìn)展
張斌儒,王浩,張超鋒,胡蓉
(四川文理學(xué)院數(shù)學(xué)與財(cái)經(jīng)學(xué)院,四川達(dá)州635000)
摘要:準(zhǔn)確預(yù)測(cè)旅游需求對(duì)旅游管理者和決策者分配有限的資源并制定科學(xué)的定價(jià)策略十分重要.對(duì)2009年以后基于網(wǎng)絡(luò)搜索數(shù)據(jù)的旅游需求預(yù)測(cè)相關(guān)文獻(xiàn)進(jìn)行評(píng)述.結(jié)論顯示,與基準(zhǔn)模型相比,加入網(wǎng)絡(luò)搜索數(shù)據(jù)的模型能顯著提高預(yù)測(cè)精度,并對(duì)將來(lái)進(jìn)一步研究進(jìn)行展望.
關(guān)鍵詞:網(wǎng)絡(luò)搜索;旅游需求;預(yù)測(cè)精度
0引言
隨著經(jīng)濟(jì)的增長(zhǎng),旅游需求呈現(xiàn)巨大的增長(zhǎng)趨勢(shì),特別是國(guó)家法定節(jié)假日的實(shí)施使得旅游市場(chǎng)潛力巨大.旅游需求的周期性和不確定性也給旅游管理者提出了挑戰(zhàn).一方面,短期內(nèi)迅速增長(zhǎng)的旅游流不但對(duì)景區(qū)和航班等造成巨大的負(fù)擔(dān),旅游飯店的接待能力面臨巨大的考驗(yàn).另一方面,非假期客流驟減,這可能導(dǎo)致部分航班座位空缺,旅游飯店客房閑置,酒店入住率低等情況,使得資源不能得到有效的利用.因此,有必要對(duì)旅游需求進(jìn)行更為精確的短期預(yù)測(cè),以最大程度降低各種風(fēng)險(xiǎn)和不確定性事件的發(fā)生,同時(shí)有利于旅游管理者進(jìn)行科學(xué)決策.
為探究旅游需求建模與預(yù)測(cè)方法的研究進(jìn)展,我們?cè)诠雀鑼W(xué)術(shù)、ScienceDirect、知網(wǎng)等數(shù)據(jù)庫(kù)上進(jìn)行了文獻(xiàn)搜索,搜索的時(shí)間跨度為2009年1月到2015年3月.刪除重復(fù)文獻(xiàn)滯后識(shí)別出與網(wǎng)絡(luò)搜索數(shù)據(jù)相關(guān)的旅游需求建模與預(yù)測(cè)相關(guān)的20篇文獻(xiàn).2008年以前很多學(xué)者對(duì)旅游需求預(yù)測(cè)相關(guān)的文獻(xiàn)進(jìn)行了評(píng)述,包括Law 等(2007),[1]Crouch(1994),[2]Li等(2005),[3]Song和 Li(2008).[4]他們的主要工作集中在對(duì)模型和預(yù)測(cè)方法的評(píng)述上,本文主要對(duì)2009年以后利用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行旅游需求預(yù)測(cè)相關(guān)的文獻(xiàn)進(jìn)行評(píng)述,從中識(shí)別出研究空白,為將來(lái)進(jìn)一步研究提供必要的指導(dǎo).
1研究方法與進(jìn)展
1.1傳統(tǒng)預(yù)測(cè)方法
在經(jīng)典文獻(xiàn)中學(xué)者主要采用兩類(lèi)方法進(jìn)行旅游需求預(yù)測(cè).第一類(lèi)為時(shí)間序列或統(tǒng)計(jì)的方法,[5]比如線性回歸,指數(shù)平滑法以及自回歸模型.第二類(lèi)主要包括人工智能的方法,比如人工神經(jīng)網(wǎng)絡(luò),灰色理論,遺傳算法,蒙特卡洛模擬等方法.[6-8]傳統(tǒng)的時(shí)間序列模型以及相關(guān)模型發(fā)展很成熟并且廣泛應(yīng)用于旅游需求預(yù)測(cè),其預(yù)測(cè)能力優(yōu)于其他方法.計(jì)算機(jī)技術(shù)的飛速發(fā)展促進(jìn)了人工智能方法在旅游需求中的應(yīng)用.當(dāng)預(yù)測(cè)變量與被預(yù)測(cè)變量之間的關(guān)系為非線性的時(shí)候,神經(jīng)網(wǎng)絡(luò)法非常有用.近幾年也有學(xué)者利用支持向量回歸、隨機(jī)森林等方法預(yù)測(cè)旅游需求.[9]
盡管如此,這些預(yù)測(cè)方法有其局限性.首先,時(shí)間序列和統(tǒng)計(jì)分析方法依賴(lài)于一致的歷史模式和穩(wěn)定的經(jīng)濟(jì)結(jié)構(gòu).一旦發(fā)生劇烈的經(jīng)濟(jì)結(jié)構(gòu)突變甚至大規(guī)模的一次性事件可能會(huì)降低模型的預(yù)測(cè)能力,況且歷史數(shù)據(jù)的發(fā)布具有一定的滯后性.其次,人工智能方法復(fù)雜費(fèi)時(shí)費(fèi)力,并且需要大量的訓(xùn)練數(shù)據(jù).因此,有必要引進(jìn)更有預(yù)測(cè)能力的預(yù)測(cè)變量來(lái)克服其缺陷.
1.2利用網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測(cè)社會(huì)經(jīng)濟(jì)活動(dòng)
截至2014年6月,我國(guó)搜索引擎用戶(hù)規(guī)模達(dá)50749萬(wàn)人,網(wǎng)民使用率為80.3%,是中國(guó)網(wǎng)民的第二大互聯(lián)網(wǎng)應(yīng)用;同時(shí)手機(jī)搜索引擎用戶(hù)規(guī)模達(dá)40583萬(wàn)人,手機(jī)網(wǎng)民使用率達(dá)到77%,是除手機(jī)即時(shí)通信以外的第二大手機(jī)應(yīng)用(中國(guó)國(guó)家旅游局旅游統(tǒng)計(jì)).因此,隨著信息技術(shù)的發(fā)展以及互聯(lián)網(wǎng)的普及,網(wǎng)民會(huì)在搜索引擎上搜索相關(guān)信息,他們?cè)诨ヂ?lián)網(wǎng)上的各種行為產(chǎn)生了豐富的數(shù)據(jù),我們可以通過(guò)各種手段對(duì)這些數(shù)據(jù)進(jìn)行追蹤,從而產(chǎn)生了新的研究方向:基于網(wǎng)絡(luò)搜索數(shù)據(jù)對(duì)經(jīng)濟(jì)活動(dòng)等進(jìn)行預(yù)測(cè).
事實(shí)上,搜索引擎數(shù)據(jù)已經(jīng)被應(yīng)用于商業(yè),金融,經(jīng)濟(jì)等預(yù)測(cè)領(lǐng)域.Choi 和 Varian(2009)通過(guò)實(shí)證表明谷歌查詢(xún)數(shù)據(jù)對(duì)預(yù)測(cè)美國(guó)汽車(chē)銷(xiāo)量,住房銷(xiāo)售以及旅游趨勢(shì)等方面有很大的價(jià)值.[10]由于Choi 和 Varian在2009年所做的開(kāi)創(chuàng)性工作,Ginsberg等(2009)利用搜索引擎數(shù)據(jù)進(jìn)行流行病預(yù)測(cè),他們的預(yù)測(cè)模型能夠提前兩周探測(cè)到流行病爆發(fā).[11]網(wǎng)絡(luò)搜索數(shù)據(jù)也能用于一般的經(jīng)濟(jì)活動(dòng)預(yù)測(cè),比如失業(yè)率預(yù)測(cè),[12]消費(fèi)預(yù)測(cè)以及電影票房預(yù)測(cè)等.[13,14]學(xué)者們的探索有力證實(shí)了網(wǎng)絡(luò)搜索數(shù)據(jù)在預(yù)測(cè)各種經(jīng)濟(jì)活動(dòng)的價(jià)值.
1.3利用網(wǎng)絡(luò)搜索數(shù)據(jù)預(yù)測(cè)旅游需求
近幾年,一些學(xué)者利用網(wǎng)絡(luò)搜索數(shù)據(jù)進(jìn)行旅游需求預(yù)測(cè),被預(yù)測(cè)變量包括景區(qū)客流、飯店接待人數(shù)、酒店入住率等.比如Choi 和 Varian (2012)應(yīng)用谷歌趨勢(shì)數(shù)據(jù)預(yù)測(cè)來(lái)自9個(gè)不同國(guó)家的來(lái)港游客量.通過(guò)將網(wǎng)絡(luò)搜索數(shù)據(jù)引入到自回歸(AR)模型,他們發(fā)現(xiàn)模型能得到好的擬合度,預(yù)測(cè)精度很高.[15]Pan等(2012)使用谷歌搜索查詢(xún)數(shù)據(jù)預(yù)測(cè)美國(guó)查爾斯頓旅游需求.他們通過(guò)引入與旅游目的地相關(guān)的查詢(xún)數(shù)據(jù)到帶有外生變量的自回歸移動(dòng)平均模型(ARMAX),預(yù)測(cè)結(jié)果表明引入搜索引擎數(shù)據(jù)降低了平均絕對(duì)百分比誤差(MAPE),對(duì)預(yù)測(cè)客房需求有著顯著的貢獻(xiàn).[16]Yang等(2015)利用搜索引擎查詢(xún)數(shù)據(jù)預(yù)測(cè)了中國(guó)旅游目的地海南的游客流量,比較了谷歌趨勢(shì)和百度指數(shù)的預(yù)測(cè)能力.結(jié)果顯示,對(duì)于中國(guó)來(lái)說(shuō),百度指數(shù)提供的網(wǎng)絡(luò)搜索數(shù)據(jù)具有更好的預(yù)測(cè)精度.在該文中作者使用了四階段過(guò)程進(jìn)行關(guān)鍵詞選擇與過(guò)濾,并使用綜合加權(quán)法進(jìn)行了指數(shù)合成,遺憾的是沒(méi)有說(shuō)明合成指數(shù)是否最具有預(yù)測(cè)能力.[17]
預(yù)測(cè)酒店接待人數(shù)和酒店入住率十分重要,精確預(yù)測(cè)對(duì)酒店管理者分配有限的資源和制定定價(jià)策略十分重要(Weatherford and Kimes 2003).[6]Pan(2012)引入谷歌周度搜索數(shù)據(jù)預(yù)測(cè)酒店客房需求,結(jié)論認(rèn)為谷歌搜索數(shù)據(jù)能提高預(yù)測(cè)精度,而谷歌搜索數(shù)據(jù)所需成本很低.[16]Yang等(2014)應(yīng)用目的地營(yíng)銷(xiāo)組織的網(wǎng)絡(luò)流量數(shù)據(jù)預(yù)測(cè)該目的地的酒店需求,結(jié)果顯示與基準(zhǔn)模型相比,基于ARMAX的模型預(yù)測(cè)精度得到了顯著提高.[18]
國(guó)內(nèi)學(xué)者在該領(lǐng)域也做了探索性的研究.黃先開(kāi)等(2014)以北京故宮為例,探討了百度指數(shù)提供的網(wǎng)絡(luò)搜索數(shù)據(jù)與景區(qū)游客量之間的關(guān)系,并對(duì)景區(qū)游客量進(jìn)行預(yù)測(cè),結(jié)果表明加入百度指數(shù)提供的網(wǎng)絡(luò)搜索數(shù)據(jù)能提高模型的預(yù)測(cè)精度.[19]王煉和賈建明(2014)結(jié)合黃金周期間景區(qū)的游客數(shù)據(jù)和網(wǎng)絡(luò)搜索數(shù)據(jù),探討了網(wǎng)絡(luò)搜索數(shù)據(jù)在旅游需求預(yù)測(cè)中的作用.實(shí)證結(jié)果顯示兩者之間存在正相關(guān)關(guān)系,相對(duì)于基準(zhǔn)模型,基于網(wǎng)絡(luò)搜索數(shù)據(jù)的模型能顯著提高旅游需求預(yù)測(cè)的精度.[20]任樂(lè)和崔東佳(2014)以北京市國(guó)內(nèi)游客流量為例,揭示了網(wǎng)絡(luò)搜索數(shù)據(jù)與游客之間的相關(guān)關(guān)系.誤差修正模型表明加入網(wǎng)絡(luò)搜索數(shù)據(jù)有效提高了預(yù)測(cè)精度.[21]張斌儒等(2015)利用百度指數(shù)提供的關(guān)鍵詞數(shù)據(jù)預(yù)測(cè)海南省月度旅游收入,與基準(zhǔn)模型相比,提高了預(yù)測(cè)精度.[22]Prosper 和 Ryan (2015)基于谷歌搜索數(shù)據(jù)利用混合頻率抽樣回歸對(duì)加勒比海地區(qū)的旅游需求進(jìn)行了預(yù)測(cè),結(jié)果顯示預(yù)測(cè)精度顯著提高.[24]
從以上文獻(xiàn)我們可以看出:與傳統(tǒng)預(yù)測(cè)方法相比,引入網(wǎng)絡(luò)搜索數(shù)據(jù)作為預(yù)測(cè)變量能得到更為精確的預(yù)測(cè),但基于網(wǎng)絡(luò)搜索數(shù)據(jù)的預(yù)測(cè)仍然在探索階段,主要體現(xiàn)在關(guān)鍵詞的選擇與過(guò)濾方面、指數(shù)合成方法以及模型選擇等.
2結(jié)論與展望
2.1數(shù)據(jù)頻率
學(xué)者主要使用周度或月度搜索數(shù)據(jù),較少使用日度數(shù)據(jù).事實(shí)上,大多學(xué)者使用了季度或月度數(shù)據(jù),因?yàn)檫@些數(shù)據(jù)可獲得性強(qiáng).而更高頻率的數(shù)據(jù)的優(yōu)點(diǎn)是能為旅游需求趨勢(shì)提供實(shí)時(shí)性的信息.盡管如此,大多研究中使用搜索數(shù)據(jù)預(yù)測(cè)旅游需求會(huì)產(chǎn)生兩個(gè)問(wèn)題.首先,更高頻率的數(shù)據(jù)很難獲得.其次,在某些情況下,我們可能面臨多頻率或混合頻率問(wèn)題( Fondeur and Karamé(2013)).[23]處理混合頻率的一般方法都是將高頻率數(shù)據(jù)簡(jiǎn)單轉(zhuǎn)化為低頻率問(wèn)題,比如平均加權(quán)的方法(Choi and Varian (2012)).[15]然而,這種處理方法會(huì)導(dǎo)致高頻數(shù)據(jù)信息的損失.在文獻(xiàn)中,只有Prosper & Ryan (2015) 使用了宏觀經(jīng)濟(jì)研究中常用的混合頻率數(shù)據(jù)處理方法.[24]其實(shí)質(zhì)是對(duì)數(shù)據(jù)進(jìn)行更為一般的加權(quán)轉(zhuǎn)換.
2.2關(guān)鍵詞選擇與指數(shù)合成
一般來(lái)說(shuō),不同的關(guān)鍵詞具有不同的搜索頻率,用于模型預(yù)測(cè)會(huì)得到不同的結(jié)果.所以關(guān)鍵詞的選擇與指數(shù)合成對(duì)模型的預(yù)測(cè)精度極為重要.盡管如此,如何從成千上萬(wàn)的關(guān)鍵詞中進(jìn)行關(guān)鍵詞選擇沒(méi)有一個(gè)系統(tǒng)的方法.大多數(shù)研究使用人工隨機(jī)選擇十余個(gè)關(guān)鍵詞作為預(yù)測(cè)變量.Choi 和 Varian (2009) 搜索關(guān)鍵詞“假期目的地/香港”是由于“香港”被收錄到谷歌趨勢(shì)里面的假期目的地的子類(lèi)別中.[10]Yang 等 (2015) 利用四階段關(guān)鍵詞選擇步驟對(duì)百度指數(shù)和谷歌趨勢(shì)數(shù)據(jù)進(jìn)行關(guān)鍵詞選擇,最后得到合成指數(shù)的關(guān)鍵詞.[17]但該方法得到的關(guān)鍵詞是否最具預(yù)測(cè)能力沒(méi)有說(shuō)明.
2.3研究空白與展望
從上述文獻(xiàn)中可以識(shí)別出一些研究空白.首先,目前大多使用百度指數(shù)和谷歌趨勢(shì)數(shù)據(jù)進(jìn)行旅游需求預(yù)測(cè),除此之外,我們可以將數(shù)據(jù)來(lái)源擴(kuò)展到博客、微博等利用大數(shù)據(jù)方法進(jìn)行研究,探索這些數(shù)據(jù)對(duì)旅游需求的影響并分析游客的行為或進(jìn)行旅游需求預(yù)測(cè).大數(shù)據(jù)能夠彌補(bǔ)調(diào)查數(shù)據(jù)對(duì)象的抽樣問(wèn)題的缺陷.使用大數(shù)據(jù)集能進(jìn)一步提高預(yù)測(cè)精度和時(shí)效性以及模擬游客的活動(dòng),幫助旅游從業(yè)者更好的進(jìn)行管理.其次,我們可以探索系統(tǒng)動(dòng)態(tài)的關(guān)鍵詞選擇與合成方法,使得更為符合實(shí)際應(yīng)用,預(yù)測(cè)能力更強(qiáng).第三,目前利用支持向量回歸進(jìn)行旅游需求預(yù)測(cè)主要大多建立單變量的模型,在引入關(guān)鍵詞數(shù)據(jù)之后,可以考慮利用多變量的支持向量回歸模型進(jìn)行旅游需求預(yù)測(cè).第四,大多旅游需求時(shí)間序列具有周期性和季節(jié)性的特征,在預(yù)測(cè)時(shí)選擇合適的方法進(jìn)行季節(jié)調(diào)整會(huì)增加預(yù)測(cè)精度.最后,可以利用大數(shù)據(jù)集探索旅游周期、預(yù)警研究、拐點(diǎn)等主題.總之,與基準(zhǔn)模型相比,如何建立模型進(jìn)行更為精確的預(yù)測(cè)對(duì)學(xué)者來(lái)說(shuō)是一種挑戰(zhàn).
參考文獻(xiàn):
[1]Law,R.,Mok,H.and Goh,C.Data Mining in Tourism Demand Analysis:A Retrospective Analysis[M].Berliu:Springer-Verlag,2007:508-515.
[2]Crouch,G.I.The study of international tourism demand:A review of practice[J].Journal of Travel Research,1994(33):41-54.
[3]Li,G.,Song,H.,& Witt,S.F.Recent developments in econometric modeling and forecasting[J].Journal of Travel Research,2005(44):82-99.
[4]Song,H.,and G.Li.Tourism Demand Modelling and Forecasting:A Review of Recent Research[J].Tourism Management,2008(2):203-209.
[5]Song H Y,Witt S.Tourism demand modeling and forecasting[M].Oxford:Pergamon Press,2000:73-74.
[6]Weatherford,L.R.,S.E.Kimes.A comparison of forecasting methods for hotel revenue management[J].International Journal of Forecasting,2003(3):401-415.
[7]Abratt,R.,Nel,D.,Nezer,C.Role of the market maven in retailing-a general marketplace influencer[J].Journal of Business and Psychology,1995(1):31-55.
[8]Andrew W P,Cranage D A,Lee C K.Forecasting hotel occupancy rates with time series models:An empirical analysis[J].Journal of Hospitality & Tourism Research,1990(2):173-182.
[9]Tsaur,R.,Chan,S.Gray support vector regression model with applications to china tourists forecasting in Taiwan[J].international journal of information and management sciences,2014,(25):121-137.
[10]Choi,H.and Varian,H.A.L.Predicting thepresent with Google Trends[J].Economic Record,2009(88):2-9.
[11]Ginsberg,Jeremy,Matthew H.Mohebbi,et al.Detecting influenza epidemics using search engine query data[J].Nature,2009(32):1012-1014.
[12]Askitas,N.,Zimmermann,K.Google econometrics and unemployment forecasting[J].Applied Economics Quarterly,2009(2):107-120.
[13]McLaren,N.,Shanbhogue,R.Using internet search data as economic indicators[J].Bank of England Quarterly Bulletin.2011(2),134-140.
[14]Hand,C.,Judge,G.Searching for the picture:Forecasting UK cinema admissions using google trends data[J].Applied Economics Letters,2012(11),1051-1055.
[15]Choi,H.,Varian,H.Predicting present with google trends[J].Economic Record,2012(S1):2-9.
[16]Pan,B.,D.C.Wu,H.Song.Forecasting hotel room demand using search engine data[J].Journal of Hospitality and Tourism Technology,2012(3):196-210.
[17]Yang X,Pan B,James A,et al.Forecasting chinese tourist volume with search engine data[J].Tourism Management,2015(46):386-397.
[18]Yang,Y.,Pan,B.,Song,H.Predicting hotel demand using destination marketing organization’S web traffic data[J].Journal of Travel Research.2014(5):1-15.
[19]黃先開(kāi),張麗峰,丁于思.百度指數(shù)與旅游景區(qū)游客量的關(guān)系及預(yù)測(cè)研究[J].旅游學(xué)刊,2013(11):93-101.
[20]王煉,賈建明.基于網(wǎng)絡(luò)信息搜索的旅游需求預(yù)測(cè)-來(lái)自黃金周的證據(jù)[J].系統(tǒng)管理學(xué)報(bào),2014(3):345-350.
[21]任樂(lè),崔東佳.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的國(guó)內(nèi)旅游客流量預(yù)測(cè)研究-以北京市國(guó)內(nèi)旅游客流量為例[J].經(jīng)濟(jì)問(wèn)題探索,2014(4):67-73.
[22]張斌儒,黃先開(kāi),劉樹(shù)林.基于網(wǎng)絡(luò)搜索數(shù)據(jù)的旅游收入預(yù)測(cè)-以海南為例[J],經(jīng)濟(jì)問(wèn)題探索,2015.
[23]Fondeur,Y.and F.Karamé.Can Google data help predict French youth unemployment?[J].Economic Modelling ,2013(30):117-125.
[24]Prosper F.Bangwayo-Skeete,Ryan W.Skeete.Can Google data improve the forecasting performance of tourist arrivals?Mixed-data sampling approach[J].Tourism Management,2015(46):454-464.
[責(zé)任編輯范藻]
Tourism Demand Forecasting Based on Web Search Query
ZHANG Binru,WANG Hao,ZHANG Chaofeng,HU Rong
(Mathematics and Finance-Economics School of Sichuan University of Arts and Sciences,Dazhou Sichuan 635000,China)
Abstract:The accurate prediction of the future tourism demand is critical to allocating limited resources and scientific decision-making for tourism manager and decision maker.A large number of review articles related to tourism demand modeling and forecasting have been conducted before 2008.This article mainly aims to review the published papers on tourism demand modeling and forecasting since 2009.The results showed that forecasting model with web search query data can improve forecasting accuracy compared to baseline model,and offer some prospects for further research in the future.
Key words:web search query; tourism demand; forecasting accuracy
收稿日期:①2015-07-01
基金項(xiàng)目:四川革命老區(qū)發(fā)展研究中心2014年度項(xiàng)目“紅色旅游對(duì)區(qū)域經(jīng)濟(jì)發(fā)展的影響及策略研究—以達(dá)州市張愛(ài)萍故居為例”(SLQ2014C-17)
作者簡(jiǎn)介:張斌儒(1980—),男,四川南江人.講師,博士研究生,主要從事旅游經(jīng)濟(jì)與數(shù)量經(jīng)濟(jì)研究.
中圖分類(lèi)號(hào):F590
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1674-5248(2016)02-0041-04
四川文理學(xué)院學(xué)報(bào)2016年2期