孫曉星
中國移動通信集團江蘇有限公司
旅游業(yè)是我國服務業(yè)的重要組成部分,又跨越多個行業(yè),是交通、餐飲、娛樂、住宿、購物等諸多傳統(tǒng)服務業(yè)的集成。旅游業(yè)向現(xiàn)代服務業(yè)的轉化,不僅是自身的要求,也會帶動相關產業(yè)的優(yōu)化升級。根據(jù)中國旅游研究院發(fā)布的研究數(shù)據(jù),旅游業(yè)對國民生產總值的綜合貢獻率已達10%。而旅游產品結構性失調、有效供給不足一直是中國旅游產業(yè)發(fā)展的主要問題。如旅游目的地已難以滿足龐大的國內游客需求,周邊游、深度游、休閑度假興起,主題公園、鄉(xiāng)村旅游、會議展覽已經(jīng)成為新的旅游需求。消費者的旅游習慣也開始發(fā)生變化,人們消費水平的提升和消費方式的多元化,使得旅游供給側改革迫在眉睫。
旅游領域的大數(shù)據(jù)應用是通過對用戶行為數(shù)據(jù)的建模和分析,獲得群體游客特征的認知和理解,在精確游客行為分析以及游客位置、游客關鍵時刻發(fā)現(xiàn)的基礎上,發(fā)現(xiàn)游客真實需求,幫助整個旅游產業(yè)鏈改善和提升游客服務體驗。
圖1 旅游大數(shù)據(jù)解決方案系統(tǒng)架構圖
國家旅游局明確提出要加強旅游信息化,而運營商具有覆蓋廣泛的移動蜂窩網(wǎng)絡,擁有豐富的網(wǎng)絡信令數(shù)據(jù),如客戶身份標識、客戶位置信息、客戶消費能力等,可以通過信息化技術提供有效信息數(shù)據(jù)支撐,建設形成針對旅游領域的大數(shù)據(jù)服務應用,彌補旅游行業(yè)信息化服務能力的不足。
建立基于分層分級的應用體系架構,主要包括業(yè)務展現(xiàn)層、能力封裝層、數(shù)據(jù)處理層、接口層。通過調用整合能力封裝層的各數(shù)據(jù)模塊,實現(xiàn)多維度的數(shù)據(jù)分析與圖形化展示,可實現(xiàn)WEB前端、手機APP和大屏三種展示形式,同時可根據(jù)需要自動形成旅游大數(shù)據(jù)分析報告。
運營商數(shù)據(jù):由運營商進行數(shù)據(jù)匯聚,匯集數(shù)據(jù)包含目前已有的手機用戶位置數(shù)據(jù)、基礎數(shù)據(jù)、用戶行為數(shù)據(jù)等。
景區(qū)景點數(shù)據(jù):通過API接口將景區(qū)內部的門票數(shù)據(jù)、閘機票務數(shù)據(jù)引入,用于系數(shù)校準和景區(qū)資源監(jiān)控。
商業(yè)運營數(shù)據(jù):引入銀聯(lián)消費數(shù)據(jù)、星級酒店客房預訂數(shù)據(jù)、互聯(lián)網(wǎng)企業(yè)數(shù)據(jù),如途牛、攜程旅行景區(qū)評價數(shù)據(jù)等。
以客流數(shù)據(jù)預測為例,新增多樣化系數(shù)和訓練模型,用于擬合實際數(shù)據(jù)和對其他各模塊進行預測分析,通過多樣化系數(shù)對原始數(shù)據(jù)進行校準,得到預測數(shù)據(jù),最后將預測數(shù)據(jù)保存至數(shù)據(jù)庫中,用于系統(tǒng)自學習。
下面介紹一下使用的機器學習:
我們用的機器學習的方法是利用人工神經(jīng)網(wǎng)絡(ANN)的特點,人工神經(jīng)網(wǎng)絡本身就是具有層次結構的系統(tǒng),具有識別復雜非線性系統(tǒng)的特性,較適合于旅游、交通流量的預測。
我們給定一個神經(jīng)網(wǎng)絡,我們假設輸入和輸出相同,然后訓練調整其參數(shù),得到每一層中的權重。從而得到輸入的幾種不同表示(每一層代表一種表示),這些表示就是特征。自動編碼器就是一種盡可能復現(xiàn)輸入信號的神經(jīng)網(wǎng)絡,為了實現(xiàn)這種復現(xiàn),自動編碼器就必須捕捉可以代表輸入數(shù)據(jù)的最重要的因素,找到可以代表原信息的主要成分。
具體過程簡單說明如下:
我國食品工業(yè)的發(fā)展越來越依賴于科學進步。從手工業(yè)走向機械化,從機械化走向自動化、智能化已成為中國傳統(tǒng)食品工業(yè)化、現(xiàn)代化的必由之路。以我們平時最熟悉的“粥”為例,我國粥類食品數(shù)量超過1000種。在粥產業(yè)尤其是八寶粥的發(fā)展過程中,傳統(tǒng)馬口鐵罐裝粥難以滿足消費者越來越高的要求,一些企業(yè)正在依靠科技提升粥的品種和品質,以滿足消費者需求,“同福碗粥”便是其中之一。企業(yè)在全國首創(chuàng)碗粥產品,攻克了易撕膜、碗定型、殺菌、設備、工藝幾大難關,采用多層高阻隔碗體,具有微波爐可加熱特性,在很大程度上避免了方便粥不易加熱的缺點。
(1)標簽分類:在我們的神經(jīng)網(wǎng)絡中,我們輸入的樣本是有標簽的,如天氣、節(jié)假日等多標簽,我們是利用二元相關算法(binary relevance,LR),即將多標簽分類問題轉化為一個或多個單標簽分類問題,將每個標簽單獨訓練一個分類器,預測的時候將多個分類器的分類結果合并,作為多標簽的分類結果。
(2)機器學習:通過學習輸入(當前客流數(shù)據(jù))和輸出(預測客流數(shù)據(jù))的恒等函數(shù),根據(jù)當前客流數(shù)據(jù)和預測客流數(shù)據(jù)之間的差去訓練調整參數(shù),進行特征提取,改變前面各層的參數(shù),直到收斂,訓練得到黑箱型的學習模型。
(3)數(shù)據(jù)預測:將數(shù)據(jù)集進行預處理,去除異常數(shù)據(jù),再結合天氣、節(jié)假日等標簽數(shù)據(jù),處理得到輸入數(shù)據(jù)矩陣;將處理過的數(shù)據(jù)集輸入至機器學習的算法模型中,輸出矩陣即為預測客流。
圖2 客流量數(shù)據(jù)預測過程
南京市建鄴區(qū)作為南京新的城市中心、中央商務區(qū)、長三角重要的金融創(chuàng)新區(qū),本身缺乏傳統(tǒng)的旅游歷史文化積淀,但卻聚焦了大量會議、體育、展覽的場所(南京國際博覽中心、江蘇大劇院、奧體中心等),南京市建鄴區(qū)政府擬打造“會獎”旅游產業(yè),為了助力建鄴區(qū)相關旅游機構供給側優(yōu)化決策,我們以第二屆中國國際精釀啤酒展覽會案例進行了大數(shù)據(jù)分析。
位置:南京國際博覽中心
事件:第二屆中國國際精釀啤酒展覽會
時間:2017.6.29-2017.7.1
第二屆中國國際精釀啤酒展覽會于2017年6月29日至7月1日在南京國際博覽中心隆重舉辦。作為中國精釀行業(yè)規(guī)模最大的展會,有100多家精釀啤酒原輔材料及設備企業(yè),100家國內外精釀酒商展出,打造中國乃至亞洲最大的精釀啤酒饕餮盛宴,全面展示精釀啤酒全產業(yè)鏈、精釀啤酒文化及創(chuàng)意。
國內參展人數(shù)遠大于境外參展人數(shù),總人數(shù)超萬。國內參展主要集中在江浙滬地區(qū),餐飲、金融、傳媒占所統(tǒng)計行業(yè)的前三,占比分別為60%、18%、10%。熱愛啤酒的更多聚集在工作多年的商務人士,并且愛酒人士中男性占據(jù)絕對優(yōu)勢(69%)。
圖3 旅游大數(shù)據(jù)人流統(tǒng)計圖
參展人員就近選擇的游玩景點TOP5,分別為南京眼、魚嘴公園、河西中央公園、綠博園、南京大屠殺紀念館;除建鄴區(qū)外其他區(qū)域的游玩景點TOP5為夫子廟、中山陵、玄武湖、老門東、明故宮。白天參會,夜晚游玩南京眼、夫子廟、老門東成為參展人員的首選。
圖4 旅游大數(shù)據(jù)景點統(tǒng)計圖
博覽中心毗鄰元通地鐵站,參展人員大多選擇便捷快速的地鐵作為首選交通工具;展會期間,參展人員停留時間集中在3小時以內。在建鄴區(qū)內,參展人員主要居住的酒店分布在南京萬達希爾頓酒店、南京國際博覽中心酒店等酒店;建鄴區(qū)外居住的酒店分布在南京玄武飯店、南京金絲利喜來登酒店等酒店,基本分布于新街口和夫子廟附近。
圖5 旅游大數(shù)據(jù)出行酒店統(tǒng)計圖
江蘇為旅游大省,具有5A和4A景區(qū)近120個,2017年上半年,江蘇全省接待境內外游客3.30億人次,同比增長13.99%,其中接待省外游客1.99億人次,同比增長24.68%,實現(xiàn)旅游總收入7195億元,增長14.1%,旅游經(jīng)濟呈現(xiàn)持續(xù)增長、蓬勃發(fā)展的強勁態(tài)勢。江蘇移動大力發(fā)展“智慧旅游”信息化服務,圍繞食、住、行、游、購、娛6大元素,以游客為中心,從多方面提供了智能化便捷的旅游信息化服務,目前獲得了一定的社會和經(jīng)濟效益。后續(xù)我們思考將進一步做好以下幾個方面的工作:
(1)加強統(tǒng)籌能力,提升平臺的包容性。加強與旅游局等政府管理機構的對接,對全域旅游工作(食、住、行、游、購、娛)進行統(tǒng)籌,增強對全域旅游情況的分析能力,以便更加直觀地反映全域旅游整體狀態(tài)。
(2)打造開放平臺,擴大平臺數(shù)據(jù)多樣性。開放系統(tǒng)平臺,提供標準化、規(guī)范化接口,將各類應用數(shù)據(jù)納入平臺系統(tǒng),如更多引入景區(qū)數(shù)據(jù)(停車數(shù)據(jù)等)和第三方數(shù)據(jù)(交通數(shù)據(jù)、酒店客房數(shù)據(jù)等)。
(3)人工智能預測,提升平臺應用價值。更多引入人工智能算法和分析,從原有的大數(shù)據(jù)統(tǒng)計分析真正升級成為大數(shù)據(jù)應用分析預測平臺,即通過平臺自身的學習迭代能力,完成對大數(shù)據(jù)的能力預測,最終形成有直接使用價值的應用模塊。