范琴
摘要:在疫情常態(tài)化防控的當下,各景區(qū)的安全運營都離不開對景區(qū)人流的實時監(jiān)控,運營商的信令數(shù)據(jù)具備規(guī)模大、實時性高、覆蓋面廣的優(yōu)點,可快速為景區(qū)提供實時的人流監(jiān)控,但由于運營商數(shù)據(jù)的定位原理依賴基站工參、出于成本考慮采集的信令字段有限、運營商用戶的市場占比動態(tài)波動等原因?qū)е戮皡^(qū)客流統(tǒng)計不準確,同時由于游客統(tǒng)計口徑的差異、景區(qū)類型的不同以及景區(qū)邊界圈選等問題,加深了基于運營商數(shù)據(jù)實現(xiàn)客流統(tǒng)計時的誤差。本文詳細闡述了當前各種景區(qū)客流監(jiān)控方式的優(yōu)缺點,深入分析了基于運營商數(shù)據(jù)實現(xiàn)客流統(tǒng)計的主客觀原因,基于可實操的層面提出了采用運營商數(shù)據(jù)實現(xiàn)客流精準統(tǒng)計的改進方案以及每種方案的優(yōu)缺點,以期為景區(qū)提供更便捷可靠、低成本的精準客流實時監(jiān)控,助力景區(qū)實現(xiàn)數(shù)智劃轉(zhuǎn)型。
關(guān)鍵詞:人流統(tǒng)計、信令數(shù)據(jù)、運營商、景區(qū)
一、研究背景
景區(qū)作為大型的人流量聚集地之一,體現(xiàn)著一省服務(wù)業(yè)的發(fā)展水平,加強景區(qū)營運管理,利用數(shù)據(jù)實現(xiàn)對景區(qū)的監(jiān)管,對提升旅游行業(yè)服務(wù)整體品質(zhì)是非常必要的。建立景區(qū)人流量監(jiān)測系統(tǒng)目標在于解決景區(qū)游客流量的監(jiān)控分析,為景區(qū)的規(guī)劃發(fā)展、營銷決策提供了科學(xué)的數(shù)據(jù)依據(jù)。
利用運營商基站定位技術(shù),對游客數(shù)量、游客屬性、景區(qū)粘度等維度的數(shù)據(jù)進行統(tǒng)計分析,實現(xiàn)景區(qū)客流負荷實時監(jiān)控預(yù)警、景區(qū)游客各類統(tǒng)計分析等功能,為各級旅游監(jiān)管部門的日常管理及公眾安全提供科學(xué)的決策依據(jù)[1]。由于基站統(tǒng)計方法的局限性,部分景區(qū)存在地理邊界不匹配、周邊環(huán)境復(fù)雜等原因,導(dǎo)致統(tǒng)計數(shù)據(jù)和實際情況存在偏差。
二、現(xiàn)狀分析
1. 監(jiān)控方式
當前部分景區(qū)還沒有開始智慧景區(qū)建設(shè),客流統(tǒng)計的主要方式還是以閘機為主,開放式景區(qū)則沒有客流統(tǒng)計的手段。閘機統(tǒng)計方式數(shù)據(jù)精準,能夠準確反映出景區(qū)接待量,但是只能反映景區(qū)范圍內(nèi)的游客總數(shù),無法分地段進行統(tǒng)計,同時也不能對游客進行大數(shù)據(jù)挖掘,無法分析游客的年齡、性別、客源地等信息[2]。
相較于傳統(tǒng)的閘機計數(shù)方式,部分景區(qū)著眼于建設(shè)智慧旅游平臺,在客流監(jiān)控模塊采用的主要是具有前置統(tǒng)計功能的攝像頭監(jiān)控和運營商基站監(jiān)控。
此外,還有一些景區(qū)會和互聯(lián)網(wǎng)公司進行合作,利用游客在景區(qū)使用開啟了GPS定位功能的APP應(yīng)用來進行游客統(tǒng)計。此種方案利用游客終端設(shè)備的GPS定位數(shù)據(jù),準確性高,但是同樣無法獲取較為全面的游客屬性信息,而且數(shù)據(jù)獲取成本和后期系統(tǒng)運維成本較高,不推薦景區(qū)使用。
四種監(jiān)控方式優(yōu)劣勢如下:
2.誤差情況
但是由于客觀原因,運營商數(shù)據(jù)對于景區(qū)的監(jiān)控預(yù)測和實際數(shù)值仍有一定差距,下面以安徽省黃山風(fēng)景區(qū)為例:
如圖所示,系統(tǒng)摘取了2019年6月28日至7月7日黃山景區(qū)累計游客數(shù)據(jù),與對應(yīng)的黃山景區(qū)閘機數(shù)據(jù)進行對比,可以看出,雙方系統(tǒng)數(shù)據(jù)差距較大,趨勢基本相同,比例基本相同。
(注:移動數(shù)據(jù)暫未考慮運營商三方占比的問題,數(shù)據(jù)來源于互聯(lián)網(wǎng)公布數(shù)據(jù))
三、誤差原因分析
針對以上事例不難發(fā)現(xiàn),單獨使用運營商的數(shù)據(jù)很難實現(xiàn)對景區(qū)游客的精確統(tǒng)計,這其中的誤差原因包含了各類分析算法本身的精度原因、也有運營商數(shù)據(jù)定位的主觀原因等。
1.客觀原因分析
1.1運營商數(shù)據(jù)及定位算法的原理導(dǎo)致數(shù)據(jù)統(tǒng)計的不準確性
首先,用來實現(xiàn)游客統(tǒng)計的運營商數(shù)據(jù)均來自于運營商網(wǎng)絡(luò)側(cè)用戶與基站發(fā)生通信時的交互數(shù)據(jù)中所攜帶的位置信息,實際上定位到的是用戶所連接的基站的位置而非用戶實際準確的GPS位置。
1.2運營商數(shù)據(jù)采集不全
運營商本質(zhì)上作為通信服務(wù)的提供商,其目標是保證網(wǎng)絡(luò)的穩(wěn)定和高速,所以其采集的數(shù)據(jù)以能夠達到分析網(wǎng)絡(luò)質(zhì)量為基礎(chǔ)目標。雖然某些通信數(shù)據(jù)、路測數(shù)據(jù)等所產(chǎn)生的附加價值可以被用來做人流統(tǒng)計與分析,但如果采集和存儲這些數(shù)據(jù)需要付出較大的成本(如MDT數(shù)據(jù)),則不在運營商數(shù)據(jù)采集的考慮范圍內(nèi)。
1.3運營商數(shù)據(jù)的片面性
目前國內(nèi)通信服務(wù)市場下,三家運營商各自瓜分了一部分市場,即使作為4G市場占有率最高的移動,其用戶占比大概在60%~75%,這個數(shù)值在各個地市區(qū)縣都有一定的區(qū)別,使用運營商數(shù)據(jù)來統(tǒng)計的游客數(shù)也只是能一部分,并且很難單純地通過一個比例來還原真實的游客數(shù)。
其次,三家運營商的數(shù)據(jù)很難做到融合。如雙卡雙待終端插入了兩張異網(wǎng)卡時,會在兩邊運營商處重復(fù)統(tǒng)計。
2.主觀原因分析
2.1游客識別算法的精準度
目前通用的方法是以駐留時間來識別游客。但不同景區(qū)游客的駐留時間不同,無法完備地枚舉各類景區(qū)的游客特征[3],導(dǎo)致了游客統(tǒng)計的不準確。
2.2景區(qū)及游客的類型、行為會影響準確度
某些景區(qū)的類型和游客的行為也會影響統(tǒng)計的精準度[3]。如內(nèi)含酒店或民宿的景區(qū),游客跨天旅游時,閘機或者門票只會在當天記錄進去有這名游客,而第二天則不會記錄,但是運營商的數(shù)據(jù)仍然會在第二天將該名游客作為一名游客進行統(tǒng)計,從而導(dǎo)致運營商統(tǒng)計的游客和景區(qū)門票統(tǒng)計的游客在某些情況下對不上。
2.3無法準確圈定出景區(qū)邊界導(dǎo)致統(tǒng)計不準
運營商網(wǎng)絡(luò)管理部門在監(jiān)測到網(wǎng)絡(luò)質(zhì)量波動后,經(jīng)過綜合分析,確定需要調(diào)整哪些基站的功率大小、方向角等參數(shù),而且各地市區(qū)縣在執(zhí)行調(diào)整策略的時候,很有可能存在“先干活再記錄”的方式,即先進行基站參數(shù)的調(diào)整,再在系統(tǒng)上修正基站的工參信息。工餐的實際情況與記錄內(nèi)容不符導(dǎo)致景區(qū)包含的基站信息胡準確,影響統(tǒng)計結(jié)果。
四、解決方案探討
為更好地挖掘運營商數(shù)據(jù)價值,為文旅委、旅游局、景區(qū)提供更加準確的游客流量統(tǒng)計數(shù)據(jù),輔助政府單位規(guī)劃省內(nèi)旅游資源,布局全域旅游戰(zhàn)略,實現(xiàn)智慧旅游的全面轉(zhuǎn)型,可以從以下三個方面著手,優(yōu)化提供的數(shù)據(jù)接口,逐步提供游客流量統(tǒng)計精度:
方案一:提升運營商數(shù)據(jù)位置解析精度:運用運營商基于信令的解析能力以及大數(shù)據(jù)實時計算技術(shù)的發(fā)展,提升回填經(jīng)緯度的準確性,從而提高區(qū)域人口統(tǒng)計、區(qū)域人員畫像的準確性;深入地圖類APP解析,輔助精準定位。
方案二:硬件輔助優(yōu)化:依靠具有前置算法的高清攝像頭、室內(nèi)小基站及其他傳感設(shè)備捕獲更精確的數(shù)據(jù),用于運營商數(shù)據(jù)擬合和糾偏。
方案三:數(shù)據(jù)建模分析:將區(qū)域進行細類劃分,根據(jù)不同區(qū)域的特征進行建模優(yōu)化,提升區(qū)域人數(shù)統(tǒng)計的精準度;運用多種大數(shù)據(jù)算法和模型,擬合人員軌跡,補充人員畫像,優(yōu)化統(tǒng)計算法。
下面將對三類方案進行細化,并初步估算了實施計劃及完成時間。
1.提升解析精度
1.1E-CID(TA+AOA)定位技術(shù)
適用場景:室外地區(qū)定位較準;
定位精度:誤差在100m~200m;
定位原理:根據(jù)TA估算基站和移動臺(手機)之間的距離,再根據(jù)AOA的角度信息獲取終端的位置信息;
數(shù)據(jù)需求:全面的基站工參數(shù)據(jù)、信令數(shù)據(jù);
實現(xiàn)難度:現(xiàn)有部分基站工參數(shù)據(jù)不全,計算復(fù)雜度較高、對資源開銷較大,定位非實時,有2h以上的延遲(具體視投入資源情況而定);
實施方案:
(1)估算基站和手機之間的距離:主要是根據(jù)測量接收信號在基站和移動臺之間的到達時間,然后轉(zhuǎn)換為距離,從而進行定位。該方法至少需要三個基站,才能計算目標的位置。三個基站測的與 MS 的距離分別為R1、R2、R3,以各自基站為圓心測量距離為半徑,繪制三個圓,其交點即為 MS 的位置。當三個基站都是 LOS 基站時,一般可以根據(jù)最小二乘(LS)算法計算 MS 的估計位置[4]。
(2)測量信號移動臺和基站之間的到達角度:以基站為起點形成的射線必經(jīng)過移動臺,兩條射線的交點即為移動臺的位置。該方法只需兩個基站就可以確定 MS 的估計位置。當基站裝有天線陣列時,天線陣列根據(jù)移動臺發(fā)送的信號來確定入射角度。兩個基站的入射角分別為a1、a2,以各基站為起點,入射角方向構(gòu)造直線的交點,即為 MS 的位置。
(3)結(jié)合前兩步得出的數(shù)據(jù),利用矩陣計算的方式,得出最終MS(手機)的位置。
1.2RF fingerprint定位技術(shù):基于指紋庫的定位方法
適用場景:更適合復(fù)雜的室內(nèi)環(huán)境,能夠較準確地區(qū)分室內(nèi)外用戶,并實現(xiàn)室內(nèi)分層的定位;
定位精度:誤差在25m~200m,受室內(nèi)信號強度影響較大;
定位原理:通過本小區(qū)及鄰小區(qū)的信號質(zhì)量特征與覆蓋地圖特征庫進行指紋特征匹配實現(xiàn)定位;
數(shù)據(jù)需求:MR數(shù)據(jù)、基站工參數(shù)據(jù);
實現(xiàn)難度:數(shù)據(jù)量較大,資源開銷較大,目前MR數(shù)據(jù)的采集是以月為單位,實時性較差;
實施方案:
(1)數(shù)據(jù)采集,形成指紋庫:室內(nèi)定位中的位置指紋法,就是事先把各個位置上的信號特征(各Wi-Fi的信號強度)測量一遍,存入指紋數(shù)據(jù)庫。定位的時候,將當前的信號特征與指紋庫中的進行匹配,從而確定位置。
(2)指紋匹配:是通過實際采集的數(shù)據(jù)與數(shù)組庫中保存的位置指紋進行匹配,算出距離,比較常用的算法有 k階類聚算法,加權(quán)k階類聚算法,神經(jīng)網(wǎng)絡(luò)算法[5]。
1.3采用技術(shù)手段實時更新景區(qū)基站靜態(tài)數(shù)據(jù)
適用場景:較為通用;
定位精度:誤差在25m~3km,受基站覆蓋范圍影響較大;
定位原理:通過圈定更準確的景點范圍,篩選出更精確的基站列表,從而統(tǒng)計游客綁定到更精確基站的數(shù)據(jù)進行游客定位,進而實現(xiàn)統(tǒng)計;
數(shù)據(jù)需求:信令數(shù)據(jù)、基站工參數(shù)據(jù);
實現(xiàn)難度:已實現(xiàn);
實施方案:
建立省運營商級別的位置庫平臺,平臺與省運營商的網(wǎng)絡(luò)優(yōu)化部門工單系統(tǒng)打通,盡量保證景區(qū)所對應(yīng)的基站工參信息更新能夠及時。
方案優(yōu)勢:靜態(tài)數(shù)據(jù)刷新流程簡化,方便快捷,通常從實施層面預(yù)估,在提出需求后三個工作日內(nèi)即可刷新數(shù)據(jù)接口中基站數(shù)據(jù)。
方案劣勢:無法判斷景區(qū)周邊及景區(qū)內(nèi)部基站分布情況;目前技術(shù)尚不能剔除周邊基站部分覆蓋情況,也無法判斷部分覆蓋的比例。
2.硬件輔助優(yōu)化
對接景區(qū)已建設(shè)的視頻監(jiān)控系統(tǒng),利用深度學(xué)習(xí)算法對視頻內(nèi)容進行解碼,提供靜態(tài)、動態(tài)兩種人流統(tǒng)計的手段,輔助景區(qū)進行特定場所的人數(shù)統(tǒng)計工作,實現(xiàn)智慧景區(qū)管理。
靜態(tài)人流統(tǒng)計:對攝像頭監(jiān)控的視頻內(nèi)容進行拍照記錄,對照片進行人臉識別,從而實現(xiàn)人流統(tǒng)計。
動態(tài)人流統(tǒng)計:將攝像頭動態(tài)視頻數(shù)據(jù)接入現(xiàn)有的AI分析平臺,實時識別視頻監(jiān)控區(qū)域內(nèi)走過的人群從而實現(xiàn)人數(shù)統(tǒng)計。
采用輔助硬件手段提供客流參考數(shù)據(jù),其結(jié)果可直接反饋給景區(qū)使用,也可作為校準數(shù)據(jù),進入基于信令數(shù)據(jù)進行客流分析的模型[6],提升運營商信令數(shù)據(jù)統(tǒng)計的準確性。
3. 數(shù)據(jù)建模優(yōu)化
通過大數(shù)據(jù)分析的方法,在現(xiàn)有數(shù)據(jù)質(zhì)量的情況,以最少的硬件及額外資源投入,持續(xù)優(yōu)化客流量統(tǒng)計算法[7]。
(1)區(qū)分常駐、流動:常駐人口定義口徑:用戶當前時間往前推15天,在這15天內(nèi)出現(xiàn)7天以上即定義為常駐人口。應(yīng)用場景:在最終統(tǒng)計景區(qū)游客數(shù)量時,剔除常駐人口。
(2)參考停留時長:在統(tǒng)計景區(qū)游客數(shù)量時,將停留半個小時以上的人群作為游客,去除那些偶然路過的人群因素。
(3)用戶軌跡擬合:底層基于位置拉鏈數(shù)據(jù)結(jié)構(gòu),存儲用戶行動的軌跡;
基于隱馬爾科夫(HMM)模型,維特比(Viterbi)動態(tài)規(guī)劃算法實現(xiàn)用戶道路軌跡的匹配,從而推測用戶在景區(qū)的駐留情況,輔助優(yōu)化基站定位的結(jié)果。
(4)第三方數(shù)據(jù)校準:參考閘機口售票類數(shù)據(jù)、定義為游客的在景區(qū)附近基站旅游類app(景區(qū)相關(guān)app)啟動次數(shù)數(shù)據(jù)、地圖類app解析出來的GPS數(shù)據(jù)以及可以調(diào)用的其他數(shù)據(jù)資源,對運營商定位數(shù)據(jù)進行優(yōu)化。
3.1第三方數(shù)據(jù)校準
采用相關(guān)性分析方法,結(jié)合各景區(qū)門票數(shù)據(jù)或經(jīng)驗數(shù)據(jù),一次擬合或二次擬合得出基站數(shù)據(jù)與門票數(shù)據(jù)的相關(guān)性公式(相關(guān)性指數(shù)0.95以上),后期基站數(shù)據(jù)通過相關(guān)性公式計算后輸出,基本可貼合景區(qū)門票數(shù)據(jù)。
方案優(yōu)勢:通過簡單線下計算即可大幅提高景區(qū)監(jiān)控準確性,開發(fā)工作量較小;只要能收集到基礎(chǔ)數(shù)據(jù)的景區(qū),都可通過個性化相關(guān)性公式調(diào)增或調(diào)減景區(qū)人數(shù),而且公式還可根據(jù)不同時間段調(diào)整。
方案劣勢:所有數(shù)據(jù)的計算都要基于原始景區(qū)數(shù)據(jù)的準確性,風(fēng)險較大;前期需要收集大量景區(qū)統(tǒng)計數(shù)據(jù),數(shù)據(jù)越多,計算公式越準確,但收集工作量越大;計算過程的調(diào)增或調(diào)減無法通過實際影響因素解釋,只能體現(xiàn)準確性提高,但無法找到影響景區(qū)人數(shù)的原因。
五、結(jié)束語
基于運營商信令數(shù)據(jù)來實現(xiàn)景區(qū)客流監(jiān)控,具備投入低、見效快的優(yōu)點,可快速幫助景區(qū)在疫情常態(tài)化防控的社會背景下實現(xiàn)景區(qū)安全生產(chǎn)經(jīng)營。但結(jié)合信令數(shù)據(jù)在各種不同情況下的統(tǒng)計誤差,需結(jié)合不同的方法加以改進,根據(jù)景區(qū)類型,采用合適的誤差修正辦法,提高景區(qū)客流監(jiān)控的準確性,助力景區(qū)實現(xiàn)數(shù)智化運營。
參考文獻:
[1]中國移動MDT技術(shù)應(yīng)用指導(dǎo)意見
[2]謝堅.客流量統(tǒng)計在旅游行業(yè)的應(yīng)用[J].信息系統(tǒng)工程,2015,000(009):86-87.
[3]項譯.基于手機信令數(shù)據(jù)的旅游交通客流特征分析研究[D].東南大學(xué),2017.
[4]柴滿,劉坤杰.一種基于信號強度分析的移動端三角定位修正方法和裝置:,CN109089214A[P].2018.
[5]常建萍,楊大成,張健明.蜂窩無線網(wǎng)絡(luò)中移動臺定位算法Fingerprint的研究[J].2013.
[6]吳秋琴.基于大數(shù)據(jù)的景區(qū)客流量統(tǒng)計評估系統(tǒng)及方法:,CN111369394A[P].2020.
[7]趙新波.基于基站位置定位的客源分析系統(tǒng)的研究[J].信息系統(tǒng)工程,2015,000(012):16-17.