孫曉星
中國移動通信集團江蘇有限公司
旅游業(yè)是我國服務(wù)業(yè)的重要組成部分,又跨越多個行業(yè),是交通、餐飲、娛樂、住宿、購物等諸多傳統(tǒng)服務(wù)業(yè)的集成。旅游業(yè)向現(xiàn)代服務(wù)業(yè)的轉(zhuǎn)化,不僅是自身的要求,也會帶動相關(guān)產(chǎn)業(yè)的優(yōu)化升級。根據(jù)中國旅游研究院發(fā)布的研究數(shù)據(jù),旅游業(yè)對國民生產(chǎn)總值的綜合貢獻率已達10%。而旅游產(chǎn)品結(jié)構(gòu)性失調(diào)、有效供給不足一直是中國旅游產(chǎn)業(yè)發(fā)展的主要問題。如旅游目的地已難以滿足龐大的國內(nèi)游客需求,周邊游、深度游、休閑度假興起,主題公園、鄉(xiāng)村旅游、會議展覽已經(jīng)成為新的旅游需求。消費者的旅游習(xí)慣也開始發(fā)生變化,人們消費水平的提升和消費方式的多元化,使得旅游供給側(cè)改革迫在眉睫。
旅游領(lǐng)域的大數(shù)據(jù)應(yīng)用是通過對用戶行為數(shù)據(jù)的建模和分析,獲得群體游客特征的認知和理解,在精確游客行為分析以及游客位置、游客關(guān)鍵時刻發(fā)現(xiàn)的基礎(chǔ)上,發(fā)現(xiàn)游客真實需求,幫助整個旅游產(chǎn)業(yè)鏈改善和提升游客服務(wù)體驗。
圖1 旅游大數(shù)據(jù)解決方案系統(tǒng)架構(gòu)圖
國家旅游局明確提出要加強旅游信息化,而運營商具有覆蓋廣泛的移動蜂窩網(wǎng)絡(luò),擁有豐富的網(wǎng)絡(luò)信令數(shù)據(jù),如客戶身份標(biāo)識、客戶位置信息、客戶消費能力等,可以通過信息化技術(shù)提供有效信息數(shù)據(jù)支撐,建設(shè)形成針對旅游領(lǐng)域的大數(shù)據(jù)服務(wù)應(yīng)用,彌補旅游行業(yè)信息化服務(wù)能力的不足。
建立基于分層分級的應(yīng)用體系架構(gòu),主要包括業(yè)務(wù)展現(xiàn)層、能力封裝層、數(shù)據(jù)處理層、接口層。通過調(diào)用整合能力封裝層的各數(shù)據(jù)模塊,實現(xiàn)多維度的數(shù)據(jù)分析與圖形化展示,可實現(xiàn)WEB前端、手機APP和大屏三種展示形式,同時可根據(jù)需要自動形成旅游大數(shù)據(jù)分析報告。
運營商數(shù)據(jù):由運營商進行數(shù)據(jù)匯聚,匯集數(shù)據(jù)包含目前已有的手機用戶位置數(shù)據(jù)、基礎(chǔ)數(shù)據(jù)、用戶行為數(shù)據(jù)等。
景區(qū)景點數(shù)據(jù):通過API接口將景區(qū)內(nèi)部的門票數(shù)據(jù)、閘機票務(wù)數(shù)據(jù)引入,用于系數(shù)校準(zhǔn)和景區(qū)資源監(jiān)控。
商業(yè)運營數(shù)據(jù):引入銀聯(lián)消費數(shù)據(jù)、星級酒店客房預(yù)訂數(shù)據(jù)、互聯(lián)網(wǎng)企業(yè)數(shù)據(jù),如途牛、攜程旅行景區(qū)評價數(shù)據(jù)等。
以客流數(shù)據(jù)預(yù)測為例,新增多樣化系數(shù)和訓(xùn)練模型,用于擬合實際數(shù)據(jù)和對其他各模塊進行預(yù)測分析,通過多樣化系數(shù)對原始數(shù)據(jù)進行校準(zhǔn),得到預(yù)測數(shù)據(jù),最后將預(yù)測數(shù)據(jù)保存至數(shù)據(jù)庫中,用于系統(tǒng)自學(xué)習(xí)。
下面介紹一下使用的機器學(xué)習(xí):
我們用的機器學(xué)習(xí)的方法是利用人工神經(jīng)網(wǎng)絡(luò)(ANN)的特點,人工神經(jīng)網(wǎng)絡(luò)本身就是具有層次結(jié)構(gòu)的系統(tǒng),具有識別復(fù)雜非線性系統(tǒng)的特性,較適合于旅游、交通流量的預(yù)測。
我們給定一個神經(jīng)網(wǎng)絡(luò),我們假設(shè)輸入和輸出相同,然后訓(xùn)練調(diào)整其參數(shù),得到每一層中的權(quán)重。從而得到輸入的幾種不同表示(每一層代表一種表示),這些表示就是特征。自動編碼器就是一種盡可能復(fù)現(xiàn)輸入信號的神經(jīng)網(wǎng)絡(luò),為了實現(xiàn)這種復(fù)現(xiàn),自動編碼器就必須捕捉可以代表輸入數(shù)據(jù)的最重要的因素,找到可以代表原信息的主要成分。
具體過程簡單說明如下:
我國食品工業(yè)的發(fā)展越來越依賴于科學(xué)進步。從手工業(yè)走向機械化,從機械化走向自動化、智能化已成為中國傳統(tǒng)食品工業(yè)化、現(xiàn)代化的必由之路。以我們平時最熟悉的“粥”為例,我國粥類食品數(shù)量超過1000種。在粥產(chǎn)業(yè)尤其是八寶粥的發(fā)展過程中,傳統(tǒng)馬口鐵罐裝粥難以滿足消費者越來越高的要求,一些企業(yè)正在依靠科技提升粥的品種和品質(zhì),以滿足消費者需求,“同福碗粥”便是其中之一。企業(yè)在全國首創(chuàng)碗粥產(chǎn)品,攻克了易撕膜、碗定型、殺菌、設(shè)備、工藝幾大難關(guān),采用多層高阻隔碗體,具有微波爐可加熱特性,在很大程度上避免了方便粥不易加熱的缺點。
(1)標(biāo)簽分類:在我們的神經(jīng)網(wǎng)絡(luò)中,我們輸入的樣本是有標(biāo)簽的,如天氣、節(jié)假日等多標(biāo)簽,我們是利用二元相關(guān)算法(binary relevance,LR),即將多標(biāo)簽分類問題轉(zhuǎn)化為一個或多個單標(biāo)簽分類問題,將每個標(biāo)簽單獨訓(xùn)練一個分類器,預(yù)測的時候?qū)⒍鄠€分類器的分類結(jié)果合并,作為多標(biāo)簽的分類結(jié)果。
(2)機器學(xué)習(xí):通過學(xué)習(xí)輸入(當(dāng)前客流數(shù)據(jù))和輸出(預(yù)測客流數(shù)據(jù))的恒等函數(shù),根據(jù)當(dāng)前客流數(shù)據(jù)和預(yù)測客流數(shù)據(jù)之間的差去訓(xùn)練調(diào)整參數(shù),進行特征提取,改變前面各層的參數(shù),直到收斂,訓(xùn)練得到黑箱型的學(xué)習(xí)模型。
(3)數(shù)據(jù)預(yù)測:將數(shù)據(jù)集進行預(yù)處理,去除異常數(shù)據(jù),再結(jié)合天氣、節(jié)假日等標(biāo)簽數(shù)據(jù),處理得到輸入數(shù)據(jù)矩陣;將處理過的數(shù)據(jù)集輸入至機器學(xué)習(xí)的算法模型中,輸出矩陣即為預(yù)測客流。
圖2 客流量數(shù)據(jù)預(yù)測過程
南京市建鄴區(qū)作為南京新的城市中心、中央商務(wù)區(qū)、長三角重要的金融創(chuàng)新區(qū),本身缺乏傳統(tǒng)的旅游歷史文化積淀,但卻聚焦了大量會議、體育、展覽的場所(南京國際博覽中心、江蘇大劇院、奧體中心等),南京市建鄴區(qū)政府?dāng)M打造“會獎”旅游產(chǎn)業(yè),為了助力建鄴區(qū)相關(guān)旅游機構(gòu)供給側(cè)優(yōu)化決策,我們以第二屆中國國際精釀啤酒展覽會案例進行了大數(shù)據(jù)分析。
位置:南京國際博覽中心
事件:第二屆中國國際精釀啤酒展覽會
時間:2017.6.29-2017.7.1
第二屆中國國際精釀啤酒展覽會于2017年6月29日至7月1日在南京國際博覽中心隆重舉辦。作為中國精釀行業(yè)規(guī)模最大的展會,有100多家精釀啤酒原輔材料及設(shè)備企業(yè),100家國內(nèi)外精釀酒商展出,打造中國乃至亞洲最大的精釀啤酒饕餮盛宴,全面展示精釀啤酒全產(chǎn)業(yè)鏈、精釀啤酒文化及創(chuàng)意。
國內(nèi)參展人數(shù)遠大于境外參展人數(shù),總?cè)藬?shù)超萬。國內(nèi)參展主要集中在江浙滬地區(qū),餐飲、金融、傳媒占所統(tǒng)計行業(yè)的前三,占比分別為60%、18%、10%。熱愛啤酒的更多聚集在工作多年的商務(wù)人士,并且愛酒人士中男性占據(jù)絕對優(yōu)勢(69%)。
圖3 旅游大數(shù)據(jù)人流統(tǒng)計圖
參展人員就近選擇的游玩景點TOP5,分別為南京眼、魚嘴公園、河西中央公園、綠博園、南京大屠殺紀(jì)念館;除建鄴區(qū)外其他區(qū)域的游玩景點TOP5為夫子廟、中山陵、玄武湖、老門東、明故宮。白天參會,夜晚游玩南京眼、夫子廟、老門東成為參展人員的首選。
圖4 旅游大數(shù)據(jù)景點統(tǒng)計圖
博覽中心毗鄰元通地鐵站,參展人員大多選擇便捷快速的地鐵作為首選交通工具;展會期間,參展人員停留時間集中在3小時以內(nèi)。在建鄴區(qū)內(nèi),參展人員主要居住的酒店分布在南京萬達希爾頓酒店、南京國際博覽中心酒店等酒店;建鄴區(qū)外居住的酒店分布在南京玄武飯店、南京金絲利喜來登酒店等酒店,基本分布于新街口和夫子廟附近。
圖5 旅游大數(shù)據(jù)出行酒店統(tǒng)計圖
江蘇為旅游大省,具有5A和4A景區(qū)近120個,2017年上半年,江蘇全省接待境內(nèi)外游客3.30億人次,同比增長13.99%,其中接待省外游客1.99億人次,同比增長24.68%,實現(xiàn)旅游總收入7195億元,增長14.1%,旅游經(jīng)濟呈現(xiàn)持續(xù)增長、蓬勃發(fā)展的強勁態(tài)勢。江蘇移動大力發(fā)展“智慧旅游”信息化服務(wù),圍繞食、住、行、游、購、娛6大元素,以游客為中心,從多方面提供了智能化便捷的旅游信息化服務(wù),目前獲得了一定的社會和經(jīng)濟效益。后續(xù)我們思考將進一步做好以下幾個方面的工作:
(1)加強統(tǒng)籌能力,提升平臺的包容性。加強與旅游局等政府管理機構(gòu)的對接,對全域旅游工作(食、住、行、游、購、娛)進行統(tǒng)籌,增強對全域旅游情況的分析能力,以便更加直觀地反映全域旅游整體狀態(tài)。
(2)打造開放平臺,擴大平臺數(shù)據(jù)多樣性。開放系統(tǒng)平臺,提供標(biāo)準(zhǔn)化、規(guī)范化接口,將各類應(yīng)用數(shù)據(jù)納入平臺系統(tǒng),如更多引入景區(qū)數(shù)據(jù)(停車數(shù)據(jù)等)和第三方數(shù)據(jù)(交通數(shù)據(jù)、酒店客房數(shù)據(jù)等)。
(3)人工智能預(yù)測,提升平臺應(yīng)用價值。更多引入人工智能算法和分析,從原有的大數(shù)據(jù)統(tǒng)計分析真正升級成為大數(shù)據(jù)應(yīng)用分析預(yù)測平臺,即通過平臺自身的學(xué)習(xí)迭代能力,完成對大數(shù)據(jù)的能力預(yù)測,最終形成有直接使用價值的應(yīng)用模塊。