鐘櫟娜
在旅游大數(shù)據(jù)研究人員和企業(yè)一起研討的會議上,經(jīng)常出現(xiàn)的現(xiàn)象就是,科研人員分享的成果,企業(yè)界的人員往往會覺得同類研究他們已經(jīng)在做了,而且可能更深入。畢竟這個時代科學轉化太快,如果說之前還是研究-知識-價值三點一線,現(xiàn)在幾乎是研究-價值的短線條了。企業(yè)在某些方面走在學術界的前端,這對學術界的人來說,是常有的事情,而這往往也意味這一領域,對研究人員是一個巨大的挑戰(zhàn)和研究轉型的提示。那么,在旅游大數(shù)據(jù)研究領域,企業(yè)已經(jīng)做了很多深入的挖掘開發(fā)和實踐應用,我們作為研究人員如何避免重復跟隨研究,轉而提出真正能夠引領行業(yè)、為行業(yè)創(chuàng)造新價值的新的科學方向呢?改進原來的思維模式可能是關鍵的一環(huán)。
首先,研究人員應該建立更具全局觀的大數(shù)據(jù)應用思維。和商業(yè)企業(yè)更多關注的用戶導向性不同,研究人員并沒有這個局限,因此思維和視野可以是面向更廣的層面。旅游大數(shù)據(jù)的研究者可能不一定能夠在數(shù)據(jù)挖掘的關鍵技術上做出更新,但是可以在應用層面研究更為廣泛。通過廣泛地觀察和研究大數(shù)據(jù)技術在其他領域的應用,以期為旅游大數(shù)據(jù)研究提供借鑒。大數(shù)據(jù)在金融、商業(yè)服務、交通等方面的應用都已經(jīng)相對深入,有很多角度或者應用是為現(xiàn)在的旅游大數(shù)據(jù)研究所忽略的,比如大數(shù)據(jù)應用在金融行業(yè)非常重要,就是根據(jù)個人的信用消費進行征信評估,但是目前并沒有針對旅游者消費習慣和偏好的旅游者深度分類研究;再比如大數(shù)據(jù)在商業(yè)服務方面很重要,就是智能交通出行推薦,但是相應的,在旅游目的地或者在旅游景區(qū)內(nèi)根據(jù)游客流量的智能線路推薦研究都是缺乏的。從更廣闊的背景來看,大數(shù)據(jù)在旅游行業(yè)可能的應用,會為研究者提供很多新鮮有趣的角度,而在這些角度上的研究突破會反向促進企業(yè)更商業(yè)化和針對性的研究與開發(fā),這樣可以為旅游大數(shù)據(jù)的深入研究拓展出新的空間。
其次,旅游研究者應該學會跳出大數(shù)據(jù)技術的局限,分析問題不應從大數(shù)據(jù)開始,而是從對人、世界、產(chǎn)品或者旅游商業(yè)行為的本質認識入手,尋找并設計實際的旅游問題然后去大數(shù)據(jù)中尋找答案。著名數(shù)據(jù)科學家、2014圖靈獎獲得者Michael Stonebraker 2016年在微軟大會上提出:“用大數(shù)據(jù)進行應用研究,不能只看數(shù)據(jù),也不必簡單執(zhí)著于技術手段本身,更不能讓技術和思維來制約研究的想象,更重要的是通過合理的實驗設計從數(shù)據(jù)還原真實的場景?!彼J為大數(shù)據(jù)研究的本質是盡可能用數(shù)據(jù)去還原真實的場景。所以,大數(shù)據(jù)研究,說簡單點,就是在統(tǒng)計學上應用機器學習,讓機器找出那些我們無法找到的東西。問題最關鍵的部分在于——應該讓機器去尋找什么。找出來之后如何解讀,這是領域專家應該知道的,只有對行業(yè)有充分的了解,才能從數(shù)據(jù)之中發(fā)現(xiàn)有價值的聯(lián)系。所以,旅游大數(shù)據(jù)專家一定先是旅游領域專家,要對旅游領域內(nèi)需要解決的問題有充分的認識,發(fā)現(xiàn)問題,學會設計實驗,熟悉數(shù)學和統(tǒng)計,知道如何應用大數(shù)據(jù)現(xiàn)有技術獲取資料以及得到自己預期的結果。
大的方法論明晰了,具體到研究設計上,很多大數(shù)據(jù)科學家都分析過,大數(shù)據(jù)研究主要在三個層次:描述性分析(發(fā)生了什么)、預測性分析(可能發(fā)生什么)、指導性分析(選擇做什么)。所以,放到旅游研究的情景下,基于大數(shù)據(jù)的旅游研究設計也可以進一步細化為以下六個層次:
1. 現(xiàn)狀描述?,F(xiàn)狀描述指的是利用各種大數(shù)據(jù)資料分析,來評估旅游組織/旅游者/旅游產(chǎn)品/旅游決策的現(xiàn)狀或者再進一步進行。這方面的研究目前是最多的,也是商業(yè)化最成熟的部分。研究者應該關注的就是哪些研究方法可以用于更好,或者更精確地還原場景。比如目前的一些商業(yè)統(tǒng)計和現(xiàn)狀描述所選取的描述和評價指標是否合理,能否通過更為合理易得的指標選擇,提供更為準確的現(xiàn)狀描述,從而避免因為輸入數(shù)據(jù)的誤差而導致的描述結果誤差。比較好的方式是使用大數(shù)據(jù)研究后,再通過小樣本的研究進行比較分析,通過三角驗證看看基于大數(shù)據(jù)的現(xiàn)狀描述研究是否能夠充分地反映現(xiàn)實。
2. 預測。很多旅游研究者都在從依賴大規(guī)模的調(diào)研轉而依賴更大規(guī)模并且可得的大數(shù)據(jù),從原來的線性模擬、時間模型、神經(jīng)網(wǎng)絡模擬等傳統(tǒng)數(shù)據(jù)方法轉移到混合頻率、網(wǎng)絡分析方法等非線性非傳統(tǒng)的方法來進行預測,最近的研究都顯示出比以往更加精確的預測結果。未來的預測研究將繼續(xù)利用可得的更加豐富的大數(shù)據(jù),包括但不局限于社交數(shù)據(jù)、交通數(shù)據(jù)、搜索引擎數(shù)據(jù),以及傳感器、手機數(shù)據(jù)等,依托于更新的分析技術,設計和選擇出更好的預測模型。
3. 行為解讀。根據(jù)大數(shù)據(jù)來分析游客的行為,理解行為的動機,從而為商業(yè)機構做出有利于未來的策略也將是重要的研究方向。旅游者行為分析是旅游研究的重要內(nèi)容,在大數(shù)據(jù)時代,旅游者不斷地創(chuàng)造和產(chǎn)生新的數(shù)據(jù),比如地理位置、消費數(shù)據(jù)、評價數(shù)據(jù)等,通過分析這些數(shù)據(jù),可以比以往任何時代都能更好地去記錄旅游者的行為,去解讀不同旅游者行為背后深層次的原因,并根據(jù)這一深入分析做出更好的商業(yè)決策。例如,利用景區(qū)內(nèi)游客移動的數(shù)據(jù),可以分析游客在景區(qū)內(nèi)移動的路徑以及原因,發(fā)現(xiàn)一些空白區(qū)域或者重要的聯(lián)結點,可以通過補充新的吸引物,從而豐富整個旅游景區(qū)的體驗。
4. 推薦。推薦是基于歷史資料,將廣告或商品推薦給潛在消費者。更好的推薦算法一直是計算機管理信息系統(tǒng)的研究熱點。一些比較好的算法或者成果,也可以適用到旅游推薦。目前,消費者和供給方來看,適用于最新推薦方法的研究都是不足的。從消費者來看,可以基于海量用戶消費結果進行旅游推薦研究,基于用戶個人消費特征進行旅游推薦研究,基于用戶自定義特征進行旅游推薦研究。從供給方來看,可以通過海量的瀏覽數(shù)據(jù)考察不同推薦產(chǎn)品和不同的推薦方法最終產(chǎn)生的點擊率以及轉換率,以尋找最優(yōu)商業(yè)價值的推薦匹配等。
5. 決策優(yōu)化。以往的旅游決策往往都是建立在人工的基礎上,不論對于旅游者還是商業(yè)機構都是一個費時費力的過程。因為大數(shù)據(jù)的產(chǎn)生和機器學習算法的使用,現(xiàn)在旅游研究已經(jīng)進入可以通過程序自動建議產(chǎn)生參數(shù),為游客和旅游企業(yè)提供解決方案的階段。比如,對于游客的決策優(yōu)化,可以利用海量的旅游線路,讓機器選擇某一特定目的地在時間約束和約束內(nèi)的最佳旅行線路,從而解決了游客自行設計線路的很多問題。對于企業(yè)來說,可以通過大量的數(shù)據(jù)輸入,去分析新的酒店、餐廳應該開設在哪一個地點會有更好的盈利,或者某一區(qū)位的地理特征,根據(jù)大數(shù)據(jù)的匹配選擇和分析,最適宜進行的旅游開發(fā)等。
總的來說,社會科學研究是一門發(fā)現(xiàn)、解釋和預測社會發(fā)展變化的學科。研究的核心在于引領社會的發(fā)展,讓社會行業(yè)的發(fā)展更加符合科學的原理。在這個快速改變的大數(shù)據(jù)時代,旅游研究要走在社會的前沿,需要研究者更廣泛地關注社會各個行業(yè),發(fā)現(xiàn)可以在新數(shù)據(jù)和新技術條件下被解決或者可以被更好解決的問題。在如潮水般涌出的數(shù)據(jù)中,大浪淘沙,找出最關鍵和有價值的數(shù)據(jù),來解讀和解決實際的問題,從而引領整個旅游行業(yè)更好地使用大數(shù)據(jù),更好的發(fā)展。
(作者系該中心主任;收稿日期:2017-04-16)endprint