王賽蘭,楊振之
(1.四川大學(xué) 旅游學(xué)院,成都610065;2.四川大學(xué)錦城學(xué)院,成都611731)
面向大數(shù)據(jù)的旅游微觀數(shù)據(jù)信息平臺(tái)研究
王賽蘭1,2,楊振之1
(1.四川大學(xué) 旅游學(xué)院,成都610065;2.四川大學(xué)錦城學(xué)院,成都611731)
傳統(tǒng)的旅游數(shù)據(jù)獲取方法已經(jīng)落后于整體的旅游業(yè)發(fā)展的需求,如何獲得客觀準(zhǔn)確的旅游數(shù)據(jù),一直是一件讓人頭痛的事。分析大數(shù)據(jù)背景和目前旅游數(shù)據(jù)統(tǒng)計(jì)中的各種問(wèn)題,研究出以微觀數(shù)據(jù)統(tǒng)計(jì)為基礎(chǔ)的旅游數(shù)據(jù)統(tǒng)計(jì)平臺(tái)的設(shè)計(jì)方案和實(shí)現(xiàn)方法,利用該平臺(tái),測(cè)試性地對(duì)成都游客在2013年國(guó)慶7天消費(fèi)情況進(jìn)行統(tǒng)計(jì)分析,證明了該平臺(tái)(MTIS)的實(shí)用價(jià)值。該平臺(tái)基于移動(dòng)互聯(lián)網(wǎng)、LBS、數(shù)據(jù)挖掘等新技術(shù),有很好的可行性和實(shí)用性,能夠?yàn)槁糜沃械牟煌瑔挝缓蛡€(gè)體提供優(yōu)質(zhì)的信息化服務(wù)。同時(shí),該平臺(tái)的應(yīng)用,將帶來(lái)旅游數(shù)據(jù)統(tǒng)計(jì)、分析、營(yíng)銷的重大突破。
旅游數(shù)據(jù);旅游數(shù)據(jù)統(tǒng)計(jì);旅游數(shù)據(jù)統(tǒng)計(jì)平臺(tái);旅游微觀數(shù)據(jù)信息平臺(tái)
隨著互聯(lián)網(wǎng)的發(fā)展,人們生產(chǎn)數(shù)據(jù)的能力越來(lái)越強(qiáng),傳統(tǒng)IT設(shè)備以及各種智能終端產(chǎn)生的信息,爆炸性增長(zhǎng)的數(shù)據(jù)充斥整個(gè)網(wǎng)絡(luò),其中與旅游相關(guān)的數(shù)據(jù)不可計(jì)數(shù)。學(xué)者、旅游管理者和政府部門已越來(lái)越重視旅游數(shù)據(jù)統(tǒng)計(jì)工作,結(jié)合互聯(lián)網(wǎng)、大數(shù)據(jù)、數(shù)據(jù)挖掘領(lǐng)域的研究已經(jīng)成為熱點(diǎn)?;ヂ?lián)網(wǎng)的大數(shù)據(jù)統(tǒng)計(jì)時(shí)代已經(jīng)到來(lái),一批學(xué)者開始研究互聯(lián)網(wǎng)的搜索行為和旅游行為之間的關(guān)系。福蒂斯(Fodness)等認(rèn)為,旅游信息搜索內(nèi)容能夠反映游客的在線信息需求[1]。潘(Pan)等研究游客如何利用網(wǎng)絡(luò)制定假日旅行計(jì)劃[2],并通過(guò)研究Excite搜索引擎日志后發(fā)現(xiàn)有超過(guò)一半以上的被調(diào)查者將酒店作為第一搜索任務(wù),然后才會(huì)轉(zhuǎn)移到交通或者其他活動(dòng)和旅游吸引物[3]。白智廣等從海量的假日旅游信息中進(jìn)行數(shù)據(jù)挖掘,研究假日旅游的狀態(tài)問(wèn)題[4]2-3。這一系列研究和成果都表明旅游數(shù)據(jù)的獲取和統(tǒng)計(jì)需要新的方法和手段。
和以往研究不同的是,本文希望從微觀數(shù)據(jù)統(tǒng)計(jì)的角度,結(jié)合移動(dòng)互聯(lián)網(wǎng)、LBS、數(shù)據(jù)挖掘等新技術(shù)和新理念,研究開發(fā)出一種能夠直接反映旅游個(gè)體行為,特別是消費(fèi)行為的數(shù)據(jù)統(tǒng)計(jì)平臺(tái),以適應(yīng)大數(shù)據(jù)時(shí)代科學(xué)研究與普通游客對(duì)旅游信息化的需求。與以往數(shù)據(jù)統(tǒng)計(jì)平臺(tái)不同的是,該平臺(tái)直接面對(duì)游客個(gè)體,而不是旅游接待單位(酒店、旅行社等),使得數(shù)據(jù)的來(lái)源更真實(shí),旅游數(shù)據(jù)的獲取和分析更科學(xué)、更有效;通過(guò)對(duì)獲取數(shù)據(jù)的統(tǒng)計(jì)分析,能夠掌握游客的行為規(guī)律、時(shí)空足跡和消費(fèi)特征,成為智慧化的旅游信息平臺(tái)。
大數(shù)據(jù)之所以稱為大數(shù)據(jù),不僅僅因?yàn)槠淞考?jí)的龐大,也因?yàn)樗c其他數(shù)據(jù)的復(fù)雜相關(guān)性[5]。游客在旅游行為中產(chǎn)生的數(shù)據(jù)不僅復(fù)雜,而且與其他因素有很大的相關(guān)性,這成為旅游大數(shù)據(jù)研究的先決條件。2012年,DealAngel(http://www.dealangel.com)作為第一個(gè)利用大數(shù)據(jù)分析方法進(jìn)行酒店比價(jià)的搜索引擎獲得成功。DealAngel的市場(chǎng)評(píng)分以酒店及周邊地點(diǎn)的價(jià)格數(shù)據(jù)為依據(jù),參考了網(wǎng)絡(luò)上超過(guò)百萬(wàn)的數(shù)據(jù)點(diǎn),為游客提供最劃算的酒店信息。目前DealAngel已經(jīng)被俄羅斯旅游網(wǎng)站One Two Trip收購(gòu),成為旗下子公司之一。根據(jù)權(quán)威的創(chuàng)投互動(dòng)AngelList社區(qū)統(tǒng)計(jì),目前世界上“大數(shù)據(jù)”概念的旅游企業(yè)主要涉及旅行計(jì)劃網(wǎng)站、旅游照片應(yīng)用、酒店評(píng)價(jià)、個(gè)性記錄和體驗(yàn)分享等各個(gè)方面[6]。在旅游以外的各個(gè)領(lǐng)域,大數(shù)據(jù)都在發(fā)揮巨大的影響。例如,利用在Twitter上的數(shù)據(jù),找到一種讓用戶可以及時(shí)找到全世界相關(guān)信息的方法[7];利用大數(shù)據(jù)對(duì)用戶進(jìn)行分類投遞廣告;在公共交通領(lǐng)域中應(yīng)用大數(shù)據(jù)進(jìn)行智能交通管理[8]。這些信息明確地表明,大數(shù)據(jù)在旅游中的應(yīng)用會(huì)更深入,也會(huì)給旅游行業(yè)帶來(lái)新的變革。
很多學(xué)者注意到互聯(lián)網(wǎng)的重要性。2002年,有學(xué)者預(yù)見到電子商務(wù)將提高旅游業(yè)的透明度和工作效率,降低邊際成本,從而將對(duì)中國(guó)旅游市場(chǎng)帶來(lái)巨大的變革[9]。國(guó)內(nèi)學(xué)者也開始注意到旅游數(shù)據(jù)統(tǒng)計(jì)的問(wèn)題,有學(xué)者對(duì)旅游的Web數(shù)據(jù)挖掘和傳統(tǒng)市場(chǎng)調(diào)查獲取的數(shù)據(jù)進(jìn)行了對(duì)比[10],研究在線搜索行為模式與游客行為的關(guān)系[11],對(duì)網(wǎng)友在論壇中發(fā)布的旅游相關(guān)信息、照片進(jìn)行統(tǒng)計(jì)分析來(lái)研究旅游者的行為。有學(xué)者利用心理學(xué)中的認(rèn)知模型,對(duì)旅游網(wǎng)站提供的信息和服務(wù)對(duì)潛在游客出游決策發(fā)揮的作用進(jìn)行了量化研究[12]。
但是,隨著移動(dòng)互聯(lián)網(wǎng)的發(fā)展,移動(dòng)端發(fā)展的速度令人驚訝。根據(jù)艾瑞咨詢公布的統(tǒng)計(jì)數(shù)據(jù),2011年智能移動(dòng)終端的出貨量就超過(guò)了PC,所以針對(duì)移動(dòng)端數(shù)據(jù)源的采集需要得到更大的重視。基于移動(dòng)端的數(shù)據(jù)源和web數(shù)據(jù)源有以下差異。
(1)移動(dòng)端數(shù)據(jù)源更有利于對(duì)旅游者進(jìn)行追蹤。LBS(location-based service)的出現(xiàn)最早是為手機(jī)用戶提供緊急救援服務(wù),有學(xué)者專門研究了用移動(dòng)工具追蹤在城市空間內(nèi)個(gè)體行為的方法,并追蹤了100起事件后證明城市中的旅游行為是可以被在線檢測(cè)的[13],現(xiàn)在已經(jīng)廣泛應(yīng)用于移動(dòng)端為用戶提供地理位置服務(wù),與此同時(shí)也產(chǎn)生了大量的地理信息數(shù)據(jù)。除了可以獲取用戶的時(shí)空行為數(shù)據(jù)外,手機(jī)移動(dòng)數(shù)據(jù)中還包括用戶的個(gè)人信息,管理系統(tǒng)根據(jù)手機(jī)號(hào)碼可以得知用戶的性別、年齡、收入等信息[14]。
(2)移動(dòng)端產(chǎn)生的是實(shí)時(shí)信息。傳統(tǒng)旅游者提供的數(shù)據(jù)是某一個(gè)時(shí)間斷面的旅游者信息,而基于手機(jī)定位可獲得個(gè)體實(shí)時(shí)移動(dòng)信息[15]。這一特點(diǎn)讓基于手機(jī)端產(chǎn)生的數(shù)據(jù)能夠最直接最迅速地反映現(xiàn)實(shí)情況。
(3)移動(dòng)端服務(wù)更易于與游客互動(dòng)。與web相比,手機(jī)服務(wù)更個(gè)人化,游客在旅行過(guò)程中也能夠便捷地使用。Google地圖、Booking Tonight以及旅行翻譯官等著名的APP軟件已經(jīng)為大量用戶提供了便捷的旅游服務(wù)。有理由相信,與旅游信息和數(shù)據(jù)相關(guān)的手機(jī)端平臺(tái)將直接受惠于普通的游客群體。
移動(dòng)互聯(lián)網(wǎng)對(duì)人們的生活產(chǎn)生了巨大的影響,與旅游相關(guān)的手機(jī)應(yīng)用也逐漸廣泛,除了各種直接面對(duì)游客的旅游攻略、機(jī)票酒店預(yù)定、旅游資訊發(fā)布的手機(jī)應(yīng)用以外,對(duì)移動(dòng)端在景區(qū)管理方面也有進(jìn)一步的研究。RBSim是一款專門用于模擬在室外環(huán)境中人類游憩行為軟件,研究和管理人員可以在網(wǎng)絡(luò)上模擬游憩環(huán)境中人們的移動(dòng),為景區(qū)管理提供依據(jù),現(xiàn)在北美和澳洲景區(qū)實(shí)踐使用[16]?;谑謾C(jī)的旅游數(shù)據(jù)統(tǒng)計(jì)分析一直比較罕見,能夠被查閱的案例不多。1999年,在日本大阪城堡會(huì)議中心,以手機(jī)作為數(shù)據(jù)獲取手段,對(duì)前來(lái)觀看相撲表演的100名被訪者進(jìn)行了研究[17];2004年,為了探索手機(jī)移動(dòng)數(shù)據(jù)在國(guó)際旅游市場(chǎng)分析中的作用,在愛沙尼亞對(duì)共計(jì)1.28億次來(lái)自96個(gè)國(guó)家的國(guó)際漫游通訊行為數(shù)據(jù)進(jìn)行了分析[16]。我國(guó)有學(xué)者利用數(shù)碼相機(jī)拍攝照片時(shí)記錄下的地理位置信息對(duì)游客時(shí)空行為進(jìn)行研究[18];或引入時(shí)間地理學(xué)和認(rèn)知供給理論與方法提出了“旅游者時(shí)空行為研究理論框架”[19]5-20,為以移動(dòng)端作為數(shù)據(jù)源的旅游數(shù)據(jù)統(tǒng)計(jì)和分析提供了理論思路。
目前國(guó)內(nèi)旅游統(tǒng)計(jì)數(shù)據(jù)基本上是宏觀數(shù)據(jù)。中國(guó)國(guó)家旅游局編制的《中國(guó)旅游統(tǒng)計(jì)年鑒》和中國(guó)旅游出版社出版的《中國(guó)國(guó)內(nèi)旅游抽樣調(diào)查資料》中關(guān)于游客花費(fèi)情況的統(tǒng)計(jì)數(shù)據(jù)比較粗略,并且其抽樣統(tǒng)計(jì)方法也不能真實(shí)反映游客的消費(fèi)情況,這些統(tǒng)計(jì)數(shù)據(jù)存在不同程度的數(shù)據(jù)造假、項(xiàng)目分類不合理、統(tǒng)計(jì)項(xiàng)目過(guò)于粗略、抽樣樣本不足、問(wèn)卷設(shè)計(jì)不合理等問(wèn)題[20]。旅游衛(wèi)星賬戶的建立同樣需要詳細(xì)的旅游消費(fèi)數(shù)據(jù)。國(guó)內(nèi)學(xué)者在研究編制江蘇省區(qū)域旅游衛(wèi)星賬戶(JSTSA)時(shí)就發(fā)現(xiàn),目前旅游消費(fèi)方面的數(shù)據(jù)主要來(lái)自全國(guó)范圍內(nèi)統(tǒng)一實(shí)施的海外旅游者和國(guó)內(nèi)旅游者抽樣調(diào)查數(shù)據(jù),但現(xiàn)有的旅游者抽樣調(diào)查中關(guān)于旅游消費(fèi)的調(diào)查項(xiàng)目比較簡(jiǎn)單,不能完全滿足JSTSA游客消費(fèi)核算賬戶中較細(xì)分類水平的旅游消費(fèi)支出項(xiàng)目研究的需要[21]。比如,《2012中國(guó)旅游統(tǒng)計(jì)年鑒》中標(biāo)明2011年江蘇省接待入境過(guò)夜游客有7373266人次,但在連云港旅游政務(wù)網(wǎng)站上公布的《關(guān)于2011年江蘇入境游客抽樣調(diào)查情況的通報(bào)》表明,該次調(diào)查回收問(wèn)卷數(shù)量為1704份,僅占當(dāng)年游客人次的0.023%[22]。這樣的數(shù)據(jù)量是否能夠反映當(dāng)?shù)赜慰偷恼鎸?shí)情況,值得懷疑。旅游數(shù)據(jù)來(lái)源的主要途徑是問(wèn)卷調(diào)查、電話訪問(wèn)等形式。雖然調(diào)查方法和問(wèn)卷設(shè)計(jì)都經(jīng)過(guò)了科學(xué)化改良,但是隨機(jī)采樣的方法樣本小、調(diào)查對(duì)象對(duì)問(wèn)卷回答的隨意性高、數(shù)據(jù)獲取周期長(zhǎng)等問(wèn)題依然無(wú)法解決。
旅游數(shù)據(jù)統(tǒng)計(jì)是一項(xiàng)世界性難題,關(guān)于數(shù)據(jù)獲取的方法和理論目前都還在探索之中。數(shù)據(jù)使用者需要高質(zhì)量的旅游數(shù)據(jù),但是對(duì)旅游者個(gè)體消費(fèi)數(shù)據(jù)的統(tǒng)計(jì)遇到了技術(shù)上的難題,這就需要我們研究和探索新的數(shù)據(jù)統(tǒng)計(jì)方法和技術(shù)。
為解決目前旅游數(shù)據(jù)統(tǒng)計(jì)分析中存在的問(wèn)題,更充分利用移動(dòng)端數(shù)據(jù)源的各種優(yōu)勢(shì),我們研究開發(fā)出一種創(chuàng)新性的數(shù)據(jù)獲取和分析方法。該方法以互聯(lián)網(wǎng)為平臺(tái),從旅游個(gè)體角度獲得真實(shí)的海量數(shù)據(jù),再進(jìn)行存儲(chǔ)與挖掘,為旅游學(xué)術(shù)研究、旅游營(yíng)銷、旅游管理等領(lǐng)域提供大規(guī)模數(shù)據(jù)存儲(chǔ)、處理、挖掘與可視化分析服務(wù);同時(shí)也為游客提供相關(guān)的旅游信息服務(wù),是旅游信息資源整合的大型互聯(lián)網(wǎng)服務(wù)平臺(tái)——“基于游客個(gè)人行為的旅游微觀數(shù)據(jù)信息平臺(tái)”(A Microdata Tourism Information System Based on Personal Behaviors),簡(jiǎn)稱為MTIS。
(一)游客個(gè)體的數(shù)據(jù)產(chǎn)生和數(shù)據(jù)需求
在旅游過(guò)程中,數(shù)據(jù)信息的產(chǎn)生是時(shí)時(shí)發(fā)生,紛繁復(fù)雜的。這樣的數(shù)據(jù)產(chǎn)生在每一次游客消費(fèi)、地點(diǎn)轉(zhuǎn)換等過(guò)程中。我們已經(jīng)確信的是,對(duì)于旅游管理機(jī)構(gòu)和旅游學(xué)術(shù)研究者來(lái)說(shuō),真實(shí)的旅游數(shù)據(jù)是有價(jià)值的,但是對(duì)于普通游客來(lái)說(shuō),他們和旅游數(shù)據(jù)之間的關(guān)系如何呢?本文認(rèn)為游客與旅游數(shù)據(jù)之間有三點(diǎn)關(guān)聯(lián)。一是游客產(chǎn)生數(shù)據(jù)。旅游數(shù)據(jù)不可能憑空發(fā)生,所有數(shù)據(jù)都是與游客有直接或者間接的聯(lián)系。二是游客有數(shù)據(jù)統(tǒng)計(jì)需求。對(duì)于普通游客來(lái)說(shuō),“花了多少錢”,“花在哪里”,是他們對(duì)旅游數(shù)據(jù)最基本的統(tǒng)計(jì)需求。此外,游客還想了解真實(shí)旅游與旅游預(yù)算之間的差距,與其他游客花費(fèi)的比較等等信息。三是旅游數(shù)據(jù)影響游客的旅游計(jì)劃。在計(jì)劃旅游時(shí),游客希望了解的信息盡可能全面詳細(xì),包括其他游客的旅行花費(fèi)、旅行行程安排、同一時(shí)間在同一地點(diǎn)的游客人數(shù)估計(jì)等等,這些信息可以直接影響他們的旅行計(jì)劃。在游客出行的整個(gè)過(guò)程中,從出行計(jì)劃決策、旅游過(guò)程中及旅行結(jié)束,整個(gè)過(guò)程游客可時(shí)時(shí)調(diào)整自己的計(jì)劃,更新自己的數(shù)據(jù),也就是說(shuō),數(shù)據(jù)更新是一個(gè)動(dòng)態(tài)的過(guò)程。
(二)MTIS平臺(tái)設(shè)計(jì)方案
基于游客、旅游管理、旅游學(xué)術(shù)研究等多方面的分析和研究,我們?cè)O(shè)計(jì)出了MTIS平臺(tái)方案(如圖1所示)。平臺(tái)的構(gòu)架由三大部分組成。第一部分是用戶端服務(wù)。其核心是在用戶使用中生成統(tǒng)計(jì)平臺(tái)的初始數(shù)據(jù),包括自動(dòng)生成的LBS地理位置數(shù)據(jù)和用戶自己錄入的旅游消費(fèi)數(shù)據(jù)。游客可以即時(shí)掌握自己的消費(fèi)數(shù)據(jù),包括一些簡(jiǎn)單的統(tǒng)計(jì)功能,例如費(fèi)用記錄、分類、對(duì)商家的評(píng)價(jià)等等。第二部分是本地?cái)?shù)據(jù)解析。在用戶生成數(shù)據(jù)后,根據(jù)統(tǒng)計(jì)平臺(tái)的需要,自動(dòng)將用戶使用生成的初始數(shù)據(jù)進(jìn)行進(jìn)一步的整理歸類分裝,形成統(tǒng)計(jì)平臺(tái)所需的數(shù)據(jù)內(nèi)容并上傳遠(yuǎn)端服務(wù)器。第三部分是遠(yuǎn)端統(tǒng)計(jì)數(shù)據(jù)。在遠(yuǎn)端服務(wù)器根據(jù)旅游微觀數(shù)據(jù)的統(tǒng)計(jì)需求,對(duì)數(shù)據(jù)進(jìn)行二次分析并存儲(chǔ),一方面形成海量的基礎(chǔ)數(shù)據(jù)庫(kù),另一方面根據(jù)需求對(duì)這些數(shù)據(jù)進(jìn)行再次挖掘和分析,形成分析結(jié)果,分別提供給游客、景區(qū)、旅游管理機(jī)構(gòu)和旅游研究者。
圖1.旅游微觀數(shù)據(jù)統(tǒng)計(jì)平臺(tái)設(shè)計(jì)方案
(三)MTIS平臺(tái)的開發(fā)實(shí)現(xiàn)
MTIS平臺(tái)由Client端和Server端組成。Client端通過(guò)第三方LBS提供商的API接口,向用戶提供基于地理位置信息的用戶數(shù)據(jù)標(biāo)記及用戶間的各種位置互動(dòng)信息。Client端安裝在用戶手機(jī)中,直接面向用戶,由基礎(chǔ)模塊、用戶生成數(shù)據(jù)模塊和用戶間交互模塊三個(gè)部分組成?;A(chǔ)模塊針對(duì)平臺(tái)Client端所需技術(shù)進(jìn)行規(guī)劃整合,為Client端其他模塊構(gòu)建實(shí)現(xiàn)基礎(chǔ);用戶生成數(shù)據(jù)模塊為總體平臺(tái)的數(shù)據(jù)產(chǎn)生部分,直接面向用戶,按照用戶實(shí)際可能產(chǎn)生的需求進(jìn)行規(guī)劃設(shè)計(jì),平臺(tái)用戶產(chǎn)生的內(nèi)容及數(shù)據(jù)通過(guò)用戶間交互模塊進(jìn)行交互,該模塊提供內(nèi)容及數(shù)據(jù)的用戶間分享,并產(chǎn)出用戶間互動(dòng)所產(chǎn)生的新數(shù)據(jù)。
Server端負(fù)責(zé)提供基礎(chǔ)的用戶數(shù)據(jù)的驗(yàn)證、傳輸,同時(shí)對(duì)收集的海量數(shù)據(jù)進(jìn)行整理和分析挖掘,分為基礎(chǔ)模塊和數(shù)據(jù)統(tǒng)計(jì)及分析模塊?;A(chǔ)模塊針對(duì)平臺(tái)Server端所需技術(shù),進(jìn)行規(guī)劃整合,保證用戶的數(shù)據(jù)的傳輸、整理及數(shù)據(jù)安全性;數(shù)據(jù)統(tǒng)計(jì)及分析模塊是平臺(tái)的核心模塊,對(duì)海量的各類型用戶數(shù)據(jù),根據(jù)不同的子模型庫(kù)進(jìn)行歸納整理,并運(yùn)用OLAP技術(shù)及數(shù)據(jù)模型庫(kù)對(duì)數(shù)據(jù)進(jìn)行分析和挖掘。
目前MTIS平臺(tái)客戶端的開發(fā)已經(jīng)基本完成,已完成的部分頁(yè)面如圖2所示。圖2中從左至右分別表示MTIS客戶端的行程規(guī)劃模塊、LBS模塊、消費(fèi)記錄模塊和初步消費(fèi)統(tǒng)計(jì)模塊。目前行程規(guī)劃模塊主要是游客自己對(duì)旅行消費(fèi)的規(guī)劃,游客可以在旅行前期利用該功能進(jìn)行行程規(guī)劃。未來(lái)該板塊會(huì)利用采集到的數(shù)據(jù),經(jīng)過(guò)統(tǒng)計(jì)挖掘,向游客推薦其感興趣的行程。LBS模塊的主要作用是記錄游客消費(fèi)的地理位置信息。游客可以點(diǎn)擊地圖上的箭頭查詢自己每一筆消費(fèi)的地點(diǎn),也可以看到自己的消費(fèi)軌跡。利用消費(fèi)記錄模塊,游客可以很方便的記錄自己的消費(fèi)情況,包括消費(fèi)的金額、消費(fèi)類型等等信息,未來(lái)還會(huì)支持用戶上傳消費(fèi)圖片和消費(fèi)心情。利用初步消費(fèi)統(tǒng)計(jì)模塊,游客可以隨時(shí)查看自己的消費(fèi)統(tǒng)計(jì)情況,包括消費(fèi)明細(xì)、消費(fèi)類型統(tǒng)計(jì)等等一般游客用戶關(guān)心的數(shù)據(jù)問(wèn)題。
以游客A使用該系統(tǒng)為例:游客A有7天假期,2萬(wàn)元預(yù)算。A希望與自己的妻子和孩子一起出去旅游。旅游以輕松休閑為主,主要考慮國(guó)內(nèi)游,如果不超出預(yù)算也可以考慮出境。A選擇的交通工具以飛機(jī)、大巴這兩種公共交通工具為主。住宿方面,A希望盡可能舒適,酒店或者評(píng)分較高的民宿都可以考慮。A將這些因素輸入MTIS系統(tǒng),系統(tǒng)會(huì)根據(jù)以前獲得的數(shù)據(jù)為A分析推薦合適的行程,包括旅游目的地、旅游消費(fèi)的預(yù)計(jì)、行程大致規(guī)劃等。旅行開始后,為了掌握自己的消費(fèi)情況,A在每次消費(fèi)以后都將本次消費(fèi)的情況記錄在MTIS系統(tǒng)中,這樣他可以隨時(shí)隨地查看自己的消費(fèi)情況統(tǒng)計(jì),包括消費(fèi)金額和類型。對(duì)于特別有興趣的景點(diǎn)和景物還會(huì)拍照留念,記錄這次消費(fèi)的心情,通過(guò)微信微博進(jìn)行分享。旅行結(jié)束以后,A可以在系統(tǒng)中查看本次旅游的詳細(xì)消費(fèi)情況,這樣他就會(huì)清楚自己在旅游中的花費(fèi)主要在哪些方面,他也可以和其他使用該系統(tǒng)的用戶進(jìn)行比較。因?yàn)镸TIS詳細(xì)記錄了每一次消費(fèi)的地理位置信息,A還可以根據(jù)這些信息回憶行程寫成旅行日記發(fā)在互聯(lián)網(wǎng)上,分享自己的旅游心得。
圖2.TIS部分客戶端界面
以上案例說(shuō)明了游客怎樣利用MTIS系統(tǒng)讓自己的旅游過(guò)程更便捷更智能,雖然其中的某些功能(如行程推薦)目前還沒(méi)有完全實(shí)現(xiàn),但是MTIS系統(tǒng)已經(jīng)可以完成基本的消費(fèi)統(tǒng)計(jì)和記錄功能,游客可以進(jìn)行簡(jiǎn)單的旅行計(jì)劃,在旅途中對(duì)自己的消費(fèi)進(jìn)行記錄和統(tǒng)計(jì)。
(一)數(shù)據(jù)來(lái)源
MTIS平臺(tái)目前正在測(cè)試和完善階段。為了測(cè)試平臺(tái)的功能,2013年8-9月,課題組以QQ群、微信、微博等手段對(duì)有意向在十一期間出游的游客推薦并安裝了該軟件的測(cè)試版。因?yàn)闇y(cè)試版發(fā)放數(shù)量有限,為了集中數(shù)據(jù)量,讓統(tǒng)計(jì)分析更有針對(duì)性,我們將推薦安裝的用戶集中在成都市內(nèi)周邊地區(qū)。389名用戶下載了該軟件,其中351名用戶安裝成功,安裝率為90.2%,其中有289名用戶在出行期間使用了該軟件。十一假期結(jié)束,通過(guò)后臺(tái)的統(tǒng)計(jì)收集,較為完整并能夠系統(tǒng)描述游客在十一期間旅游消費(fèi)行為的數(shù)據(jù)有209份,成為我們分析的樣本。這些樣本主要涵蓋行程規(guī)劃、地理位置信息、消費(fèi)統(tǒng)計(jì)、消費(fèi)感受等信息內(nèi)容。行程規(guī)劃包括計(jì)劃旅行天數(shù)、旅行目的地、旅行預(yù)算、同行人數(shù)等信息,這些信息是由用戶在旅行開始前輸入系統(tǒng)的。地理位置信息主要記錄每一次用戶記錄消費(fèi)時(shí)刻的地理位置信息,由系統(tǒng)自動(dòng)記錄。消費(fèi)統(tǒng)計(jì)目前設(shè)計(jì)消費(fèi)的分類主要有八項(xiàng)——交通、駕車、住宿、娛樂(lè)、餐飲、購(gòu)物、門票、其他,每一項(xiàng)消費(fèi)又有細(xì)節(jié)分類,方便用戶對(duì)自己的消費(fèi)進(jìn)行歸類。例如,交通類消費(fèi)下面包含飛機(jī)、火車、巴士、輪船、的士;駕車類費(fèi)用包含租車費(fèi)、油費(fèi)、罰款、過(guò)路費(fèi)。消費(fèi)感受是指對(duì)某些消費(fèi)項(xiàng)目,用戶可以記錄自己的體驗(yàn)感受(是否物有所值,是否值得推薦給其他人),可以給商家進(jìn)行評(píng)分,同時(shí)可以在微博、朋友圈分享該次消費(fèi)經(jīng)歷。
MTIS生成的數(shù)據(jù)內(nèi)容是龐大復(fù)雜的,可以反映游客在旅游中的各種消費(fèi)行為、地理信息、情感信息等數(shù)據(jù)。以數(shù)據(jù)庫(kù)中三個(gè)有代表性的樣本為例,數(shù)據(jù)樣本統(tǒng)計(jì)包括了旅行目的地、旅行天數(shù)、同行人數(shù)等11個(gè)項(xiàng)目,其中7項(xiàng)與消費(fèi)相關(guān)。從表1數(shù)據(jù)可以看出,樣本2瀘沽湖旅游的餐飲消費(fèi)總額是1014元,其中正餐811元,特色小吃120元,夜宵83元;交通費(fèi)770元,其中油費(fèi)580元,出租費(fèi)190元。如果加上后續(xù)開發(fā)中計(jì)劃游客上傳照片和游客之間的交互功能,那么形成的信息就足夠反映游客在旅行過(guò)程中的行為規(guī)律、時(shí)空足跡和消費(fèi)特征。
表1.數(shù)據(jù)樣本案例
(二)數(shù)據(jù)分析
本次測(cè)試性研究的核心問(wèn)題是:成都游客在國(guó)慶七天的旅游消費(fèi)與哪些因素相關(guān)?除了與旅行天數(shù)、人數(shù)有較為明顯的相關(guān)性以外,有哪些隱性的相關(guān)性沒(méi)有被發(fā)現(xiàn)。
考慮到數(shù)據(jù)的非正態(tài)性,我們采用Spearman相關(guān)系數(shù)進(jìn)行分析。相關(guān)分析是對(duì)兩個(gè)變量之間的相關(guān)程度進(jìn)行研究的多元統(tǒng)計(jì)分析方法。我們引入了旅游地10月份的CPI作為一個(gè)變量,另一個(gè)變量就是人們的旅游消費(fèi)總計(jì)。數(shù)據(jù)的相關(guān)分析表明,CPI與旅游消費(fèi)總計(jì)的Spearman相關(guān)系數(shù)僅為-0.327,且檢驗(yàn)的p值為0.014<0.05,即檢驗(yàn)是顯著的。這表明從我們收集的數(shù)據(jù)來(lái)看,游客消費(fèi)多少與所在城市CPI無(wú)關(guān)(結(jié)果見表2)。
表2.游客消費(fèi)與當(dāng)?shù)鼐用裣M(fèi)指數(shù)相關(guān)分析
如果游客的消費(fèi)與城市CPI指數(shù)無(wú)關(guān),那么其中是否還有其他隱性的規(guī)律?我們嘗試分析了MITS平臺(tái)中收集到的其他消費(fèi)數(shù)據(jù),對(duì)住宿消費(fèi)與餐飲、購(gòu)物、娛樂(lè)消費(fèi)的相關(guān)性進(jìn)行了相關(guān)分析。結(jié)果表明,住宿消費(fèi)與餐飲、購(gòu)物、娛樂(lè)消費(fèi)的Spearman相關(guān)系數(shù)分別為0.907、0.871、0.623,檢驗(yàn)的p值均小于0.0001,故其相關(guān)性是高度顯著的??梢?,住宿消費(fèi)與餐飲、購(gòu)物、娛樂(lè)消費(fèi)額有正相關(guān)關(guān)系,并且相關(guān)性是非常顯著的(表3所示)。
表3.游客住宿消費(fèi)與餐飲消費(fèi)指數(shù),購(gòu)物消費(fèi)指數(shù)及娛樂(lè)消費(fèi)指數(shù)相關(guān)分析結(jié)果
根據(jù)本次的數(shù)據(jù)分析,游客的消費(fèi)情況與旅游目的地城市CPI無(wú)關(guān),但游客住宿消費(fèi)與餐飲、購(gòu)物、娛樂(lè)消費(fèi)有正向相關(guān)性。也就是說(shuō),樂(lè)于在住宿上消費(fèi)的游客,更有興趣在購(gòu)物、娛樂(lè)、餐飲上花錢。以上例子說(shuō)明,MITS平臺(tái)可以有效地收集個(gè)人在旅游中的消費(fèi)數(shù)據(jù),反映了游客在旅游中的真實(shí)行為,這些數(shù)據(jù)可以被分析,得出的結(jié)果對(duì)旅游管理和科研都有重要的意義。
本文詳細(xì)介紹了MTIS平臺(tái)的設(shè)計(jì)思路與方案,提出并實(shí)踐了一種取得和分析微觀旅游數(shù)據(jù)、旅游大數(shù)據(jù)的方法。MTIS平臺(tái)是一種基于移動(dòng)互聯(lián)網(wǎng)和大數(shù)據(jù)分析方法建立的旅游數(shù)據(jù)收集、分析的平臺(tái)系統(tǒng)。相對(duì)于傳統(tǒng)的旅游數(shù)據(jù)收集統(tǒng)計(jì)方法,它有以下優(yōu)勢(shì)。第一,數(shù)據(jù)真實(shí)可靠,可信度高,可以避免造假、不實(shí)信息的產(chǎn)生。第二,宏觀與微觀相結(jié)合。MTIS平臺(tái)既能夠反映旅游區(qū)域的整體數(shù)據(jù),又能夠反映旅游個(gè)體的消費(fèi)細(xì)節(jié)。本文限于篇幅,只對(duì)數(shù)據(jù)作了相關(guān)性的分析,通過(guò)挖掘海量數(shù)據(jù),可精確地分析游客的時(shí)空足跡,把握游客行為規(guī)律和消費(fèi)特征。第三,數(shù)據(jù)動(dòng)態(tài)性高。旅游管理者可以隨時(shí)監(jiān)測(cè)動(dòng)態(tài)變化而不受時(shí)間限制。第四,擺脫“統(tǒng)計(jì)報(bào)表”層面,有數(shù)據(jù)挖掘潛力。第五,能真實(shí)地服務(wù)于普通游客,使其直接享受到旅游信息化的便捷。
MTIS平臺(tái)也存在其局限,比如需要游客擁有智能手機(jī)并安裝客戶端。這對(duì)于年齡大的游客并不現(xiàn)實(shí),所以匯總的數(shù)據(jù)多是以中青年為主。但家庭出游中,中青年游客的使用過(guò)程也將小孩和老人的出行安排列入其中。另外,讓游客了解并愿意安裝也需要過(guò)程。但是,相信隨著中青年,特別是80、90后的成長(zhǎng),我們對(duì)于該平臺(tái)的應(yīng)用前景是很樂(lè)觀的。
目前MTIS平臺(tái)的開發(fā)工作已經(jīng)進(jìn)入測(cè)試和完善的階段,不久就可以提供給用戶免費(fèi)下載,但這只是平臺(tái)研發(fā)的第一步,后續(xù)將有更多的研究任務(wù)。第一步,完成平臺(tái)所有關(guān)鍵模塊的設(shè)計(jì),游客可以順利地保存數(shù)據(jù),并可以在旅行過(guò)程中或旅行結(jié)束后看到自己消費(fèi)的完整統(tǒng)計(jì)(已達(dá)成);第二步,支持用戶上傳圖片功能,并且可以記錄消費(fèi)感受(正在開發(fā)中);第三步,支持用戶行程規(guī)劃的功能,用戶可以在旅行前期將計(jì)劃路線、酒店信息、機(jī)票信息等內(nèi)容錄入,在旅行途中可以檢閱,真正形成一個(gè)服務(wù)于普通游客,特別是自由行游客的旅游信息化平臺(tái)(正在開發(fā)中);第四步,旅行行程推薦功能,在形成一定規(guī)模的數(shù)據(jù)庫(kù)以后,用戶輸入自己的旅游預(yù)算、旅游時(shí)長(zhǎng)、旅游地喜好、交通方式等參數(shù)后,系統(tǒng)可以依據(jù)已有的數(shù)據(jù)向用戶推薦行程(正在開發(fā)中)。
旅行行程推薦功能是平臺(tái)未來(lái)的核心功能之一。這一功能的實(shí)現(xiàn)手段是利用大數(shù)據(jù)分析方法對(duì)游客的行為進(jìn)行預(yù)期。我們樂(lè)觀地認(rèn)為,游客的行為特別是消費(fèi)行為是受制于某些規(guī)律、模型以及原理法則的,可以重現(xiàn)和預(yù)測(cè),游客的行為不再被視為不相關(guān)、隨意偶然的獨(dú)立事件,而是有次序、可重復(fù)的。研究隱藏在游客消費(fèi)中的規(guī)律,找出正確的模型,就可以對(duì)游客行為進(jìn)行預(yù)測(cè),為使用該平臺(tái)的用戶提供符合他們期待的旅游計(jì)劃。當(dāng)然,為游客提供旅游計(jì)劃只是該平臺(tái)大數(shù)據(jù)應(yīng)用的一部分,一旦形成數(shù)據(jù)采集到數(shù)據(jù)挖掘的良性循環(huán),在景區(qū)管理、旅游營(yíng)銷等領(lǐng)域都將帶來(lái)巨大的突破,這也將是我們未來(lái)研究和工作的重點(diǎn)。
[1]FODNESS D,MURRAY B.A Model of Tourist Information Search Behavior[J].Journal of Travel Research,1999,(3):220-231.[2]PAN B,F(xiàn)ESENMAIER D R.Online Information Search:Vacation Planning Process[J].Annals of Tourism Research,2006,(3):809-832.
[3]PAN B,LITVIN S W,O’DONNELL T E.Understanding Accommodation Search Query Formulation:the First Step in Putting“Heads in Beds”[J].Journal of Vacation Marketing,2007,(4):371-381.
[4]白智廣.假日旅游數(shù)據(jù)挖掘和流量模型的研究[D].北京:北京工商大學(xué)碩士學(xué)位論文,2006.
[5]LEE Chuang-Hong,CHIEN Tza-Feng.Leveraging Microblogging Big Data with a Modified Density-based Clustering Approach for E-vent Awareness and Topic Ranking[J].Journal of Information Science,2013,(4):523-543.
[6]MARIUS B.Big Data Has Big Money Chasing It and Travel Startups Want in[EB/OL].(2013-03-12).http://skift.com/2013/03/12/10-big-data-travel-startups-on-angellist-living-large-making-huge-promises/.
[7]VILAJOSANA I,LLOSA J,et al.Bootstrapping Smart Cities through a Self-sustainable Model Based on Big Data Flows[J].Communications Magazine,2013,(6):128-134.
[8]陳美.大數(shù)據(jù)在公共交通中的應(yīng)用[J].圖書與情報(bào),2012,(6):22-28.
[9]楊振之,胡海霞,等.中國(guó)旅游電子商務(wù)市場(chǎng)分析[J].四川師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2002,(2):50-55.
[10]李君軼,楊敏.基于Web數(shù)據(jù)挖掘的旅游需求分析與預(yù)測(cè)[J].旅游科學(xué),2007,(6):48-52.
[11]李君軼.旅游數(shù)字足跡:在線揭示游客的時(shí)空軌跡[J].思想戰(zhàn)線,2013,(3):103-107.
[12]程霞,單芳.旅游網(wǎng)站特性對(duì)潛在游客行為意向的影響[J].四川師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2011,(1):63-69.
[13]RAUBAL M,MILLER H J,BRIDWELL S.User-centered time Geography for Location-Based-Services[J].Geografiska Annater,2004,(4):245-265.
[14]黃瀟婷,柴彥威,趙瑩,申悅.手機(jī)移動(dòng)數(shù)據(jù)作為新數(shù)據(jù)源在旅游者研究中的應(yīng)用探析[J].旅游學(xué)刊,2012,(8):39-44.
[15]AHAS R,MARK U.Location Based Services:New Challenges for Planning and Public Administration[J].Futures,2005,(6):547-561.
[16]ITAMI R,RAULINGS R,MACLAREN G,et a1.RBSim 2:Simulating the Complex Interactions between Human Movement and the Outdoor Recreation Environment[J].Journal for Nature Conservation,2003,(4):278-286.
[17]ASAKURA Y,HATO E.Tracking Survey for Individual Travel Behavior Using Mobile Communication Instruments[J].Transportation Research Part C:Emerging Technologies,2004,(12):273-291.
[18]李春明,等.基于地理參考照片的景區(qū)游客時(shí)空行為研究[J].旅游學(xué)刊,2013,(10):30-36.
[19]黃瀟婷.旅游者時(shí)空行為研究[M].北京:中國(guó)旅游出版社,2011.
[20]師守祥,郭為.我國(guó)旅游統(tǒng)計(jì)數(shù)據(jù)評(píng)價(jià)及開發(fā)應(yīng)用研究[J].旅游學(xué)刊,2010,(2):19-23.
[21]李明耀,等.我國(guó)區(qū)域旅游衛(wèi)星賬戶理論與實(shí)踐的若干問(wèn)題研究[J].旅游學(xué)刊,2004,(2):11-15.
[22]連云港市旅游局.關(guān)于2011年江蘇入境游客抽樣調(diào)查情況的通報(bào)[EB/OL].(2012-02-20).http://www.lygtour.gov.cn/article/82.html.
On the Big-Data-Oriented Tourism Microdata Information Platform
WANG Sai-lan1,2YANG Zhen-zhi1
(1.school of Tourism,Sichuan University,Chengdu,Sichuan 610065;2.Sichuan University Jincheng College,Chengdu,Sichuan 611731,China)
It is quite difficult to obtain the accurate tourism data since the traditional way to obtain tourism data lags far behind the demand of overall tourism development.With the analysis of big data background and problems in tourism data statistics,this paper offers a design plan and implement methods of tourism data statistics platform based on micro data statistics.To testify the practical value of the platform(MTIS),the paper goes further to use the platform to do a test statistical analysis of tourists’consumption in Chengdu during the National Day Holidays of 2013.Based on the new technology of mobile Internet,LBS and data mining,the platform is so feasible and practical that it can provide units and individuals involved in tourism with good information service.Moreover,its application will make a breakthrough to the data statistics,analysis and marketing of tourism.
tourism data;tourism data statistics;tourism data statistics platform;a microdata tourism information system based on personal behariors(MTIS)
F590.63
A
1000-5315(2015)01-0054-08
[責(zé)任編輯:鐘秋波]
2014-09-18
四川省教育廳人文社會(huì)科學(xué)重點(diǎn)研究基地西華大學(xué)“工業(yè)設(shè)計(jì)產(chǎn)業(yè)研究中心”資助科研項(xiàng)目“基于移動(dòng)端的旅游微觀數(shù)據(jù)統(tǒng)計(jì)平臺(tái)設(shè)計(jì)”(GY-14YB-12)。
王賽蘭(1981—),女,湖北武漢人,四川大學(xué)旅游學(xué)院博士生、四川大學(xué)錦城學(xué)院講師,研究方向?yàn)橹腔勐糜?、文化遺產(chǎn)與旅游開發(fā);
楊振之(1965—),男,重慶人,博士,四川大學(xué)旅游學(xué)院教授、博士生導(dǎo)師,研究方向?yàn)樾蓍e與旅游規(guī)劃、旅游目的地管理。
四川師范大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版)2015年1期