安洋 李軍懷 王懷軍
摘? ?要:目前疫情防控依舊處于關(guān)鍵階段,如何有效做好高校復(fù)學(xué)復(fù)課和疫情防控工作成為國家和教育工作者重點關(guān)注的問題。隨著高校校園網(wǎng)絡(luò)基礎(chǔ)設(shè)施的持續(xù)升級完善,通過無線接入點(Access Point,AP)日志信息進行學(xué)生位置及軌跡分析成為可能。文章提出了一種基于無線日志的校園區(qū)域人數(shù)統(tǒng)計與接觸追蹤方法,該方法通過對無線AP日志信息的采集與分析,實現(xiàn)對學(xué)生位置信息的無感知獲取,動態(tài)可視化呈現(xiàn)高校日常教育教學(xué)中學(xué)生的位置分布、樓宇等區(qū)域的人流密度、學(xué)生在校的行為軌跡等,為高校復(fù)學(xué)后的疫情防控提供有效支持。
關(guān)鍵詞:疫情防控;無線日志;無感知定位;接觸追蹤
中圖分類號:G434 文獻標(biāo)志碼:A 文章編號:1673-8454(2021)01-0075-04
一、引言
隨著移動網(wǎng)絡(luò)的迅速普及,以智能手機為代表的移動設(shè)備在日常生活中隨處可見。通過對移動智能設(shè)備相關(guān)的用戶行為數(shù)據(jù)進行無感知采集和分析,能夠為疫情防控中區(qū)域人數(shù)統(tǒng)計與人員接觸追蹤提供幫助。隨著高校信息化水平的不斷提高,以及基礎(chǔ)網(wǎng)絡(luò)設(shè)施的持續(xù)升級和完善,校園無線網(wǎng)絡(luò)幾乎達(dá)到了教學(xué)區(qū)與生活區(qū)的全覆蓋,校園網(wǎng)絡(luò)逐漸成為高校學(xué)生生活中不可或缺的重要組成部分,與學(xué)生的學(xué)習(xí)、工作和生活緊密相連。鑒于校園網(wǎng)絡(luò)連接的便攜性、靈活性、無感知認(rèn)證等特性,加之網(wǎng)絡(luò)日志信息的快速增長,通過對如此海量的日志信息進行挖掘、關(guān)聯(lián)分析,能夠發(fā)現(xiàn)大量有價值的用戶行為信息,為學(xué)生提供更多智能化的服務(wù)。
對于校園無線網(wǎng)絡(luò)而言,無處不在的WiFi設(shè)備,大量密集的AP設(shè)備部署于其中,移動設(shè)備的每一次AP接入、上線、下線均會在網(wǎng)絡(luò)設(shè)備上有所記錄[1]。無線AP具有區(qū)域有效的特性,對于分布于該區(qū)域內(nèi)的移動設(shè)備無線上網(wǎng)提供服務(wù),當(dāng)用戶從當(dāng)前區(qū)域移動到另外一個區(qū)域時,會發(fā)生AP切換,因而根據(jù)AP日志記錄結(jié)合AP位置分布可以實現(xiàn)用戶位置信息的獲取及移動軌跡的查詢。同時,兩個用戶在距離相近的區(qū)域持續(xù)一段時間,該區(qū)域的無線AP中會記錄該區(qū)域范圍內(nèi)的用戶設(shè)備MAC地址。
基于無線網(wǎng)絡(luò)接入的上述特點,在疫情防控背景下,通過對校園無線上網(wǎng)日志進行分析和挖掘,可以實現(xiàn)學(xué)生分布熱力圖、人流密度分析與預(yù)警、軌跡追蹤、特殊人群行為預(yù)警、建筑物樓層人數(shù)分析、校園區(qū)域?qū)崟r人數(shù)統(tǒng)計等應(yīng)用功能,為疫情防控背景下高校復(fù)學(xué)復(fù)課后,校園環(huán)境中的區(qū)域人數(shù)統(tǒng)計和特殊情況下的接觸追蹤提供服務(wù)。
二、相關(guān)研究
目前,針對人數(shù)統(tǒng)計的方法大致分為三種:基于計算機視覺的人數(shù)統(tǒng)計方法、基于可穿戴設(shè)備的人數(shù)統(tǒng)計方法和基于WiFi的人數(shù)統(tǒng)計方法。基于計算機視覺的人數(shù)統(tǒng)計方法采用攝像設(shè)備收集場景中的圖像或圖像序列,然后使用圖像或視頻處理相關(guān)技術(shù)實現(xiàn)目標(biāo)的人體檢測和人數(shù)識別。該方法由于在設(shè)備、方法、用戶隱私、光線條件等方面的局限性使得其難以在人數(shù)統(tǒng)計系統(tǒng)中廣泛應(yīng)用?;诳纱┐髟O(shè)備的人數(shù)統(tǒng)計方法通過監(jiān)測者佩戴內(nèi)置有傳感器的設(shè)備進行人數(shù)識別與統(tǒng)計,該方法需要被監(jiān)測對象必須佩戴特定設(shè)備才行,在舒適性與便攜性等方面存在一定的局限。與前兩種方法不同,基于WiFi的人數(shù)統(tǒng)計方法更能實現(xiàn)無感知的被動識別,不受特定場景和時間的限制,低成本,實現(xiàn)簡單,更適合推廣應(yīng)用。
在無感知人數(shù)統(tǒng)計方法的研究中,郭玉彬等人[2]針對某高校無線網(wǎng)絡(luò)日志數(shù)據(jù)進行分析挖掘,首先對校園內(nèi)各建筑物的無線網(wǎng)絡(luò)連接人次進行統(tǒng)計,其次采用R-樹索引,結(jié)合密度聚類算法得到校園區(qū)域劃分,最后實現(xiàn)人群聚集點分布和區(qū)域之間人群移動規(guī)律的獲取。該方法有效地解決了中心經(jīng)緯坐標(biāo)動態(tài)變化的問題,可長期、持續(xù)對校園網(wǎng)日志數(shù)據(jù)進行處理而不受校園網(wǎng)擴建和AP不穩(wěn)定的影響,但識別粒度僅限于校園區(qū)域或樓宇,并未細(xì)分到具體樓層和教室,在室內(nèi)識別方面涉及較少。丁亞三等人[3]提出了一種基于WiFi-CSI的室內(nèi)人數(shù)識別方法WiCount,該方案通過信道狀態(tài)信息的幅值波動來描述室內(nèi)人數(shù)的變化,并結(jié)合機器學(xué)習(xí)算法實現(xiàn)對人的計數(shù)。該方法雖然在一定程度上提高了室內(nèi)人數(shù)識別方法的性能,但其識別人數(shù)僅能保持在4人以下,無法適用于較大規(guī)模的室內(nèi)人數(shù)識別,且需要經(jīng)歷線下的模型訓(xùn)練過程,無法保障識別的實時性。Manpreet等人[4]提出了一種基于WiFi日志信息的用戶購物意圖識別和位置預(yù)測方法,該方法將物理空間通過銷售物品類別進行語義化標(biāo)識,然后進一步分析用戶行為和位置預(yù)測在網(wǎng)絡(luò)搜索內(nèi)容與物理空間上下文之間的相似度,以更好地發(fā)現(xiàn)有消費意向的用戶。Traunmueller等人[5]通過WiFi探測器和位置數(shù)據(jù)對城市居民的移動軌跡進行分析。Ciftler等人[6]通過WiFi探測器接收到的連接請求對樓宇內(nèi)的居住率進行統(tǒng)計。
與之前的研究相比,本文通過對校園廣泛部署的無線接入點日志信息進行分析,能夠無感知實現(xiàn)校園區(qū)域室內(nèi)和室外的用戶定位與人數(shù)統(tǒng)計,且統(tǒng)計粒度更為精細(xì),可具體到樓宇內(nèi)的樓層、辦公室、教室或宿舍,從而更易被廣泛應(yīng)用于校園的安全、管理、疫情防控等工作中。
三、基于無線日志的區(qū)域人數(shù)統(tǒng)計與接觸追蹤方法
基于無線日志的區(qū)域人數(shù)統(tǒng)計與接觸追蹤方法整體框架如圖1所示。首先對無線上網(wǎng)日志、用戶基本信息、用戶設(shè)備MAC地址與學(xué)工號對應(yīng)關(guān)系、無線AP與部署位置對應(yīng)關(guān)系等數(shù)據(jù)通過相關(guān)技術(shù)進行采集;其次對無效數(shù)據(jù)、缺失數(shù)據(jù)、數(shù)據(jù)不一致等問題數(shù)據(jù)進行剔除、補全與標(biāo)準(zhǔn)化等預(yù)處理操作;接著根據(jù)關(guān)鍵字信息進行日志分類,針對每種類別的日志數(shù)據(jù)選擇合適的解析規(guī)則進行關(guān)鍵信息提取,結(jié)合用戶基本信息等輔助數(shù)據(jù)進行信息聚合分析,建立用戶定位模型;基于用戶定位模型,進一步實現(xiàn)位置分布、人數(shù)統(tǒng)計、軌跡查詢和接觸追蹤等功能;最后結(jié)合可視化建模技術(shù)進行應(yīng)用呈現(xiàn),實現(xiàn)區(qū)域人數(shù)統(tǒng)計與用戶軌跡查詢,并在特殊情況下快速完成接觸追蹤,為高校復(fù)學(xué)后的疫情防控工作提供技術(shù)支持。
1.基于無線AP的人員定位原理
在校園無線網(wǎng)絡(luò)覆蓋區(qū)域,用戶的移動智能設(shè)備會通過發(fā)送周期性的探測請求來掃描并收集環(huán)境中可用的無線通信信道。每一個無線AP都由一個唯一MAC地址進行標(biāo)識,當(dāng)無線AP接收到移動設(shè)備的探測請求后會予以回應(yīng),無論是否加密,是否已連接,甚至信號強度不足以顯示在設(shè)備的無線信號列表中,移動設(shè)備都可以獲取到該AP廣播出來的MAC地址。接著,移動智能終端選定確定連接的SSID并向其發(fā)送驗證信息,無線AP對驗證信息進行響應(yīng)認(rèn)證。最后,移動智能終端向該無線AP發(fā)送連接請求,無線AP響應(yīng)連接請求并將該設(shè)備接入互聯(lián)網(wǎng)[1]。如圖2所示。
在此過程中,根據(jù)IEEE對無線WiFi標(biāo)準(zhǔn)(即802.11協(xié)議)的定義可知,當(dāng)移動智能設(shè)備在訪問互聯(lián)網(wǎng)時,如果有多個AP具有相同的SSID,則移動設(shè)備會選擇信號最強的AP進行連接,即距離自己最近的無線AP?;诖?,通過用戶上網(wǎng)所連接的無線AP部署位置信息便可以獲知用戶當(dāng)前所在位置,從而進行區(qū)域人數(shù)統(tǒng)計與軌跡查詢。對無線日志進行分析,獲取到用戶設(shè)備與無線AP的連接狀態(tài),結(jié)合無線AP在校園的物理部署位置以及用戶信息與MAC地址對應(yīng)關(guān)系表,即可實現(xiàn)用戶定位,最后通過可視化工具進行顯示,直觀地描述個人在校園的行為軌跡。
2.區(qū)域人員定位與人數(shù)統(tǒng)計方法
基于無線日志信息進行區(qū)域人員定位、人數(shù)統(tǒng)計、軌跡查詢及接觸追蹤等應(yīng)用分析時,需要將無線接入日志與用戶信息、AP位置信息進行關(guān)聯(lián),才能獲得有效的用戶及具體位置信息,其中的關(guān)聯(lián)關(guān)系如圖3所示。
為了實現(xiàn)本文的功能設(shè)計,在此過程中需要三張輔助數(shù)據(jù)表進行聯(lián)合分析,分別為用戶基本信息表、用戶設(shè)備MAC地址與學(xué)工號對應(yīng)關(guān)系表、無線AP與部署位置對應(yīng)關(guān)系表。數(shù)據(jù)采集階段主要對以上內(nèi)容進行采集,針對不同的數(shù)據(jù)源,采集方式各不相同。
本文主要通過Flume技術(shù)、ETL技術(shù)和數(shù)據(jù)導(dǎo)入三種方式進行原始數(shù)據(jù)采集。首先,基于Flume技術(shù)實現(xiàn)實時流日志數(shù)據(jù)采集,采用Kafka進行實時流調(diào)度處理,通過實時流數(shù)據(jù)聚合技術(shù),結(jié)合Spark Stream完成實時流計算功能,實現(xiàn)對日志數(shù)據(jù)的實時計算與分析處理。通過ETL技術(shù)采集用戶基本信息、用戶設(shè)備MAC地址與學(xué)工號之間的關(guān)系對應(yīng)表。采用Excel導(dǎo)入形式獲取最新的無線AP位置分布信息。
將數(shù)據(jù)采集階段獲取的數(shù)據(jù)進行清洗轉(zhuǎn)換,刪除無效數(shù)據(jù),制定日志解析規(guī)則。同時,將采集到的數(shù)據(jù)信息規(guī)范化,保持格式統(tǒng)一。在無線AP日志數(shù)據(jù)中,每一行代表一條日志數(shù)據(jù),其中記錄著用戶移動設(shè)備的MAC地址、IP地址、上下線時間、當(dāng)前連接無線AP的名稱和設(shè)備連接狀態(tài)等信息。從AP管理端AC(Access Controller,接入控制器)上獲取的日志數(shù)據(jù)包含AP配置、AP上下線、用戶連接等多種類別日志信息,因此,本文主要對涉及用戶位置獲取的五類日志進行處理,如表1所示。
由于日志所屬的類別不同,因此每條日志數(shù)據(jù)的格式也并不固定。首先需要通過關(guān)鍵字進行日志類別篩選,將對應(yīng)的日志信息劃分到正確的分組隊列,接著通過每個類別日志特定的正則表達(dá)式進行日志解析,提取核心關(guān)鍵信息。
本文方法將校園劃分為若干個子區(qū)域,如操場、教學(xué)1號樓、1號餐廳等。對于某一特定子區(qū)域而言,可以通過對子區(qū)域范圍內(nèi)AP設(shè)備的移動終端連接量進行分析來實現(xiàn)人數(shù)統(tǒng)計。移動終端以MAC地址作為唯一標(biāo)識,因此某區(qū)域的人數(shù)計算如公式1所示:
S=∑f(MAC)(1)
其中,S表示當(dāng)前區(qū)域總?cè)藬?shù),f(MAC)表示區(qū)域內(nèi)移動設(shè)備的MAC地址。
由于某一區(qū)域內(nèi)用戶可能會多次連接區(qū)域內(nèi)不同或相同的AP設(shè)備,因此在人數(shù)統(tǒng)計時需要進行去重處理,保證統(tǒng)計過程中一個MAC地址只被計算一次。同時,對于區(qū)域邊界范圍可能會出現(xiàn)的路過連接現(xiàn)象,即用戶處于該區(qū)域以外,但在某種情況下,短暫連接到該區(qū)域的AP設(shè)備,使得AP日志中會包含此部分噪音的MAC地址,因此在人數(shù)統(tǒng)計時,通過設(shè)定連接持續(xù)時間(如10分鐘),排除此種噪音數(shù)據(jù)??紤]到以上兩點,本文在人數(shù)統(tǒng)計過程中采用公式2進行區(qū)域內(nèi)有效MAC地址計算:
f(MAC)=總MAC地址-重復(fù)MAC地址-噪音MAC地址(2)
學(xué)生在校行為軌跡特征主要由活動時間和活動空間兩部分構(gòu)成。本文基于上述日志處理結(jié)果,結(jié)合校園區(qū)域功能劃分,分析學(xué)生行為軌跡的時空特征。假設(shè)U={u1,u2,…,un}表示用戶集合,L={l1,l2,…,lm}表示校園區(qū)域集合,T={t1,t2,…,tk}表示時間集合,則某一用戶ui隨著時間推移的行為軌跡Pi如公式3所示:
Pi={(ui1,li1,ti1),(ui2,li2,ti2),(ui3,li3,ti3),……}(3)
本文采用窗口大小H對時間進行窗口劃分,如半小時為一個時間窗口,則會得到固定時間間隔的用戶位置信息w=(l,t),一系列用戶位置信息組成的序列可以作為用戶軌跡特征來描述用戶行為軌跡移動,如公式4所示:
Pi={ui,w1,w2,w3,……}(4)
基于上述用戶行為軌跡描述,可以進一步實現(xiàn)用戶軌跡查詢、接觸追蹤等具體應(yīng)用。
四、實驗分析
本文的實驗數(shù)據(jù)來自某高校無線網(wǎng)絡(luò)設(shè)備日志,校園無線AP總數(shù)為1480個,實驗部分采集了2020年4月份無線網(wǎng)絡(luò)日志數(shù)據(jù)作為樣本數(shù)據(jù)。原始樣本數(shù)據(jù)共3GB,經(jīng)過分析與處理后的有效數(shù)據(jù)為238366條。
基于本文提出的方法,設(shè)計開發(fā)了區(qū)域人數(shù)統(tǒng)計與接觸追蹤系統(tǒng),如圖4所示。該系統(tǒng)首先展示了校園區(qū)域的人數(shù)信息,通過下鉆可以獲取樓宇等區(qū)域內(nèi)部每層甚至每間教室的人數(shù)及人員列表信息;其次,通過設(shè)置起止時間,可以查詢某段時間內(nèi)用戶的校園活動軌跡;最后,可以實現(xiàn)特殊情況下的接觸追蹤查詢,快速準(zhǔn)確地獲取親密接觸人員列表信息,無需再依賴用戶的記憶,以及繁瑣的方式來獲取接觸人員信息,從而有效精準(zhǔn)地記錄用戶的接觸行蹤。
五、結(jié)語
隨著無線傳感技術(shù)的快速發(fā)展,以非接觸式、被動感知和便于部署等特點而廣泛受到關(guān)注的WiFi感知技術(shù)成為校園位置預(yù)測與人數(shù)統(tǒng)計領(lǐng)域的研究熱點。本文提出利用移動智能設(shè)備結(jié)合無線上網(wǎng)日志信息進行人員位置及軌跡追蹤,為有效抗擊疫情提供了信息化手段的支持。
參考文獻:
[1]賴特.無線WiFi接入點欺騙及其檢測技術(shù)研究[J].信息與電腦(理論版),2020,32(3):154-156.
[2]郭玉彬,吳宇航,周哲帆等.基于密度聚類算法的校園人群聚集和移動規(guī)律分析[J].計算機應(yīng)用研究,2020,37(3):688-692.
[3]丁亞三,郭斌,辛通等.WiCount:一種基于WiFi-CSI的人數(shù)識別方法[J].計算機科學(xué),2019,46(11):297-303.
[4]Manpreet Kaur, Flora D. Salim, Yongli Ren, Jeffrey Chan, Martin Tomko, and Mark Sanderson. Shopping intent recognition and location prediction from cyber-physical activities via wi-fi logs[C].Proceedings of the 5th Conference on Systems for Built Environments. New York, USA: Association for Computing Machinery,2018:130-139.
[5]Traunmueller M, Johnson N E, Malik A, et al. Digital footprints: Using WiFi probe and locational data to analyze human mobility trajectories in cities[J].Computers, Environment and Urban Systems,2018:4-12.
[6]Ciftler B S, Dikmese S, Guvenc I, et al. Occupancy Counting With Burst and Intermittent Signals in Smart Buildings[J].IEEE Internet of Things Journal, 2018,5(2):724-735.
(編輯:王曉明)