鄧黎妮 陳昕然
摘 要:如何為每一位旅客提供更優(yōu)質(zhì)的服務(wù)是每一個機場人的使命。在新一輪的機場建設(shè)中,民航各建設(shè)單位也都紛紛投入大量人力物力打造智慧機場。本文介紹了在大數(shù)據(jù)時代的背景下,如何利用已有的、可以獲取的旅客數(shù)據(jù),梳理旅客在機場的流程,并提取旅客特征。結(jié)合大數(shù)據(jù)思維和工具,了解旅客需求,為旅客提供更個性化的服務(wù)。這對智慧機場建設(shè)中旅客挖掘有一定價值和意義。關(guān)鍵詞:機場旅客;大數(shù)據(jù);特征分析 1 引言近幾年,大數(shù)據(jù)和人工智能技術(shù)已逐漸融入人們的生活,并已成為科技行業(yè)最具價值的領(lǐng)域。在民用航空“十三五”發(fā)展規(guī)劃下,民航業(yè)發(fā)展也進入快車道,如何利用大數(shù)據(jù)和人工智能等前沿技術(shù),為民航旅客提供一個安全、舒適、高效的航站區(qū)環(huán)境和飛行旅程,已經(jīng)成為各大機場、航空公司的重要課題。而機場作為民航產(chǎn)業(yè)中的重要一環(huán),只有不斷加深大數(shù)據(jù)與人工智能技術(shù)的運用與實踐,改革傳統(tǒng)業(yè)務(wù)與管理模式,才能從根本上提升機場運營的智能化水平,適應(yīng)整個產(chǎn)業(yè)的發(fā)展。基于機器學習等先進算法的人工智能技術(shù)已經(jīng)在多個領(lǐng)域發(fā)揮出積極的作用,相信在未來將承擔越來越多的社會分工。通過旅客以往的數(shù)據(jù)去了解旅客的需求[1][2],挖掘出旅客潛在的行為模式,不僅會為旅客帶來更好的體驗,也會為機場節(jié)省更多的人力和物力,最終為機場帶來更大的效益。例如將人臉識別[6]技術(shù)嵌入安檢信息系統(tǒng),算法自動比對身份證照片,大大的提高驗證準確率及工作效率。2 旅客數(shù)據(jù)盡管民航信息化建設(shè)多年,已經(jīng)形成了相當完備的信息網(wǎng)。然而各個部門之間的數(shù)據(jù)缺乏有效整合,形成了一個個的“數(shù)據(jù)孤島”,大量有價值的數(shù)據(jù)資源不能發(fā)揮更大作用。數(shù)據(jù)無法聯(lián)通、不能共享導(dǎo)致有效的技術(shù)方案得不到實施。機場是典型的服務(wù)型產(chǎn)業(yè),旅客客流在時間和空間上表現(xiàn)出高集聚性。直接通過旅客在出行過境、安檢信息、場內(nèi)互聯(lián)網(wǎng)行為數(shù)據(jù)進行分析,挖掘出用戶的不同行為特征。再利用機器學習中決策樹、SVM等分類算法[3]對旅客進行分類,以此來確定機場旅客市場的細分,進而針對不同旅客類別群體制定對應(yīng)的服務(wù)、品牌策略等。首先需要解決數(shù)據(jù)源的問題,數(shù)據(jù)獲取途徑:1、旅客基礎(chǔ)信息、VIP旅客數(shù)據(jù),旅客過安檢的數(shù)據(jù);2、旅客通過微信關(guān)注或會員注冊,獲得用戶的ID信息;3、 通過小基站或wifi來對旅客的手機進行跟蹤,記錄其在候機樓軌跡和到商家的頻次和時間,對店鋪進行精準的數(shù)據(jù)采集;4、通過室內(nèi)LBS定位及GPS定位,生成用戶的區(qū)域分布圖;5、通過候機樓監(jiān)控視頻的數(shù)據(jù);獲取數(shù)據(jù)后要進行數(shù)據(jù)的關(guān)聯(lián)整合,關(guān)聯(lián)的目的就在于從多維度收集旅客數(shù)據(jù),刻畫完整的旅客畫像。通過數(shù)據(jù)關(guān)聯(lián)整合,對單一用戶進行標簽化整理,實現(xiàn)用戶精準描述。3 特征選擇特征選擇[4]的目的是從旅客的多個特征中抽取一些攜帶信息較多的特征來描述旅客,過濾掉那些攜帶特征信息量較少的特征。即是把非結(jié)構(gòu)化的旅客信息表示成計算機能夠識別的向量,它為抽象、復(fù)雜的文本建立一個數(shù)學模型,用它來表示和描述旅客。分類器是通過訓練已知類別的向量發(fā)現(xiàn)各個類別中的特征分布模型,并通過大量已知類別向量對模型不斷進行測試、反饋、學習,提高模型性能,最后根據(jù)模型對待分類向量進行匹配,從而發(fā)現(xiàn)其所屬類別。4 機場旅客特征機場旅客分為進港和出港,旅客的基本信息、購票方式、機場消費情況、值機行為等數(shù)據(jù)可根據(jù)不同需求進一步細分。通過這些數(shù)據(jù)能快速的分析不同特征用戶的差異,同時檢驗出傳統(tǒng)機場市場細分能否有效的運用于大數(shù)據(jù)環(huán)境下機場用戶特征的研究。 根據(jù)旅客的基本信息和在候機樓的活動軌跡和行為特征,發(fā)現(xiàn)旅客的需求和偏好。機場旅客標簽,主要從五個方面進行闡述:1、基礎(chǔ)標簽:年齡段、性別、職業(yè)、職位、國籍、教育程度;2、乘機頻次標簽:常旅客、非常旅客、周期性乘機、非周期性乘機;3、候機樓消費喜好標簽:美食、購物;4、網(wǎng)頁瀏覽偏好:視頻、新聞;5、候機樓停留時間;從大數(shù)據(jù)角度研究機場用戶的行為特征,可以能挖掘出一些潛在的用戶群體,這些群體具有互聯(lián)網(wǎng)背景下的新特性,能快速適應(yīng)新的乘機購物體驗。如文獻[5]關(guān)于機場的研究中,就用聚類分析挖掘出包含多個特征的七個用戶行為群。根據(jù)這樣的分類,能快速匹配出用戶的潛在需求,這也是大數(shù)據(jù)的優(yōu)勢所在,對群體的分類會更加的詳細,明確,從而有利于機場更有針對性的做出相關(guān)策略。5 結(jié)束語從機場設(shè)施采集的旅客數(shù)據(jù),不僅能給機場服務(wù)、商業(yè)提供支持,還可用于分析并做出實時的方案,為場內(nèi)人力、物力的調(diào)度安排提供決策依據(jù),甚至減少潛在的安全隱患,防止問題的發(fā)生。例如通過對通道口、登機口安裝傳感器和安全攝像頭捕獲人流數(shù)據(jù)進行統(tǒng)計分析,并將這些數(shù)據(jù)與來自控制塔的天氣數(shù)據(jù)和實時航班到達數(shù)據(jù)進行結(jié)合。根據(jù)這些數(shù)據(jù)可增加、減少安檢口,為登機口管理提供幫助,如自動打開最靠近中轉(zhuǎn)飛機的登機口、調(diào)度登機口人員。根據(jù)區(qū)域人流量,安排相關(guān)工作人員進行保潔和服務(wù)。有大數(shù)據(jù)的依托,大量費時費力的工作可無需人工干預(yù),信息渠道更加高效便捷。參考文獻:[1] 鄭迅雷,陳加芬,萬濤.從互聯(lián)網(wǎng)用戶行為分析入手降低運營成本[J].鐵路通信信號工程技術(shù).2008.06.[2] Magdalini Eirinaki, Miehalis Vazirgiannis: Web Mining for Web Personalization, ACM Transactions on internet Teclmology,Vol.3,No.1,F(xiàn)ebruary 2003,Pages 1-27.[3] 崔建明,劉建明.基于SVM算法的文本分類技術(shù)研究[J].計算機仿真.2013.02[4] Forman G.An extensive empirical study of feature selection metrics for text classification[J].Journal of Machine Learning Research.2003,3(1):1533-7928.[5] 劉攀.基于數(shù)據(jù)挖掘的航空公司客戶價值模型.華南理工大學,2010[6] 周桐. 基于PCA的人臉識別系統(tǒng)的設(shè)計與實現(xiàn)[D]. 哈爾濱工業(yè)大學自動化控制與設(shè)計系,2007.作者簡介:鄧黎妮(1989-)女,重慶人,助理工程師,研究方向:信息與通信工程