摘要:手機(jī)信令數(shù)據(jù)能夠?qū)崟r(shí)反映城市中用戶的移動(dòng)模式和位置變化,通過分析這些數(shù)據(jù),可以實(shí)現(xiàn)對城市交通狀況的實(shí)時(shí)監(jiān)控,及時(shí)發(fā)現(xiàn)交通擁堵的潛在區(qū)域,為交通管理部門提供快速響應(yīng)的能力。本文基于手機(jī)信令數(shù)據(jù),構(gòu)建了宏觀交通模型,通過提取用戶軌跡、劃分用戶區(qū)域并以之構(gòu)建模型評估出行模式和預(yù)估交通流量,實(shí)現(xiàn)了基于手機(jī)信令大數(shù)據(jù)在宏觀交通模型中的應(yīng)用。通過實(shí)驗(yàn)測試,模型在預(yù)測高峰時(shí)段和非高峰時(shí)段的交通流量時(shí)表現(xiàn)良好,具有較高的準(zhǔn)確性,能夠有效提高城市交通系統(tǒng)的運(yùn)行效率。
關(guān)鍵詞:手機(jī)信令;大數(shù)據(jù)仿真;動(dòng)態(tài)流量分配;交通模型;用戶軌跡
一、引言
信令位置數(shù)據(jù)作為一種新興的數(shù)據(jù)源,具有覆蓋范圍廣、實(shí)時(shí)性強(qiáng)、成本低等特點(diǎn),已成為城市交通管理領(lǐng)域的研究熱點(diǎn)[1]。通過對手機(jī)信令數(shù)據(jù)的分析,可以實(shí)時(shí)監(jiān)控城市交通狀況,預(yù)測交通流量,識別出行模式,為交通管理提供科學(xué)依據(jù)[2]。本文通過分析手機(jī)信令數(shù)據(jù)在宏觀交通模型中的處理方法,構(gòu)建了基于手機(jī)信令數(shù)據(jù)的宏觀交通模型。通過提取用戶軌跡信息,計(jì)算用戶在地理空間中的分布情況,識別用戶的出行模式,以實(shí)現(xiàn)對交通流量的準(zhǔn)確評估。本文通過研究信令位置數(shù)據(jù)在宏觀交通模型中的應(yīng)用方法,以期為交通管理提供有用的決策支持,改善城市的交通狀況。
二、手機(jī)信令數(shù)據(jù)在宏觀交通模型中的處理方法
(一)數(shù)據(jù)采集
Y市作為重要的交通樞紐和商業(yè)中心,其公共交通系統(tǒng)逐漸完善,但同時(shí)也面臨著交通擁堵的問題。為改善Y市的交通狀況,提高居民出行效率,本次研究旨在移動(dòng)網(wǎng)絡(luò)運(yùn)營商企業(yè)內(nèi)部進(jìn)行數(shù)據(jù)探索,以保障數(shù)據(jù)的安全性、可靠性和有效性。通過實(shí)時(shí)收集Y市基站信息、用戶移動(dòng)軌跡和信號強(qiáng)度變化等基礎(chǔ)信息,獲取數(shù)據(jù)內(nèi)容包含用戶的唯一標(biāo)識符IMSI、基站ID(LAC和CELLID)、時(shí)間戳、事件類型(連接、斷開、位置更新)等。通過收集信令位置數(shù)據(jù),實(shí)時(shí)監(jiān)控Y市交通流量、車速和道路狀況,從而為交通管理提供決策支持。
(二)數(shù)據(jù)匿名
為保護(hù)用戶隱私,需對手機(jī)信令數(shù)據(jù)進(jìn)行匿名處理。通過從手機(jī)信令數(shù)據(jù)中提取個(gè)人手機(jī)號碼、IMSI等數(shù)據(jù)識別信息(PII)后,對所提取的PII進(jìn)行匿名化處理,以防止用戶隱私泄露[3]。首先,將PII替換為隨機(jī)生成的數(shù)字,并使用選定的哈希函數(shù)對PII進(jìn)行哈希運(yùn)算,得到哈希值。隨后,將哈希值作為種子值,通過偽隨機(jī)數(shù)生成器(PRNG)生成隨機(jī)數(shù),由此,將生成的隨機(jī)數(shù)替換為PII。當(dāng)無法從匿名化數(shù)據(jù)中恢復(fù)原始PII時(shí),則認(rèn)為隱私保護(hù)達(dá)到了預(yù)期的效果。
(三)數(shù)據(jù)整合
數(shù)據(jù)匿名后,為實(shí)現(xiàn)數(shù)據(jù)整合,需將來自不同來源、不同格式的數(shù)據(jù)整合為統(tǒng)一的格式,便于后續(xù)分析?;谛帕钗恢脭?shù)據(jù)在宏觀交通模型中的處理路線如圖1所示。
在進(jìn)行數(shù)據(jù)整合時(shí),首先需要對匿名化后的數(shù)據(jù)進(jìn)行解析,提取有用的信息時(shí)間戳、位置等信息,確保數(shù)據(jù)的準(zhǔn)確性和完整性。隨后,選定Y市特定商業(yè)區(qū)域在特定時(shí)間段內(nèi)的數(shù)據(jù),并篩選出與宏觀交通模型分析相關(guān)的數(shù)據(jù),將時(shí)間戳格式、坐標(biāo)格式等不同數(shù)據(jù)轉(zhuǎn)換為統(tǒng)一的格式,確保數(shù)據(jù)格式的一致性。同時(shí),將來自不同來源的數(shù)據(jù)進(jìn)行融合,形成完整的數(shù)據(jù)集,以提供全面的宏觀交通模型分析。通過去除錯(cuò)誤記錄、異常值、重復(fù)數(shù)據(jù)等,確保數(shù)據(jù)質(zhì)量。最后,將整合后的數(shù)據(jù)存儲在分布式數(shù)據(jù)庫中,以便于后續(xù)的數(shù)據(jù)處理和分析。通過實(shí)施上述步驟,可以實(shí)現(xiàn)對匿名化后的手機(jī)信令數(shù)據(jù)的整合,為宏觀交通模型分析提供可靠的數(shù)據(jù)基礎(chǔ)。
三、基于手機(jī)信令數(shù)據(jù)的宏觀交通模型構(gòu)建
(一)用戶軌跡提取
對于每個(gè)用戶,利用時(shí)間戳和經(jīng)緯度信息,構(gòu)建其在Y市特定區(qū)域內(nèi)的移動(dòng)軌跡。首先,通過設(shè)置時(shí)間窗口,可以確定一個(gè)連續(xù)軌跡。如果一個(gè)用戶在1小時(shí)內(nèi)連續(xù)更新位置信息,則這些信息可以拼接成一個(gè)軌跡點(diǎn)。同時(shí),根據(jù)需求,也可以合并相近時(shí)間內(nèi)的軌跡點(diǎn),減少數(shù)據(jù)量,從而對軌跡點(diǎn)的粒度進(jìn)行適當(dāng)調(diào)整。通過分析軌跡數(shù)據(jù),可提取用戶的速度、停留點(diǎn)等移動(dòng)模式。如果兩個(gè)軌跡點(diǎn)在時(shí)間差Δt內(nèi),且位置差Δ1小于某個(gè)閾值L,則可以將這兩個(gè)點(diǎn)合并為一個(gè)軌跡點(diǎn)。流量矩陣的元素Aij可以表示從區(qū)域i到區(qū)域j的流量,其計(jì)算公式見式(1):
(二)區(qū)域劃分
(三)出行模式識別
該函數(shù)提供了一個(gè)量化的指標(biāo),用于評估模型在出行模式識別任務(wù)中的性能。通過將模型的預(yù)測結(jié)果與實(shí)際結(jié)果進(jìn)行比較,能夠提供一個(gè)具體的數(shù)值,表示預(yù)測的準(zhǔn)確性。在出行模式識別問題中,使用交叉熵?fù)p失函數(shù)可以幫助模型實(shí)現(xiàn)預(yù)測出行模式與實(shí)際出行模式之間差異的最小化,從而提高模型預(yù)測結(jié)果的準(zhǔn)確性。通過分析不同出行模式的分布和變化,可以更準(zhǔn)確地預(yù)測未來的交通流量和需求,從而優(yōu)化交通布局。
(四)交通流量預(yù)估
在進(jìn)行交通流量預(yù)估時(shí),需要提取時(shí)間、空間、交通等流量特征,并應(yīng)用線性回歸模型以實(shí)現(xiàn)準(zhǔn)確預(yù)估交通流量。線性回歸模型在處理線性關(guān)系時(shí)表現(xiàn)良好,能夠提供較為準(zhǔn)確的預(yù)測結(jié)果。對于交通流量這種受到多種因素影響的復(fù)雜系統(tǒng),線性回歸模型可以通過提取關(guān)鍵特征來捕捉交通流量與影響因素之間的線性關(guān)系,從而實(shí)現(xiàn)較為準(zhǔn)確的預(yù)估。同時(shí),線性回歸模型可以通過調(diào)整模型參數(shù)優(yōu)化模型的性能,以適應(yīng)不同的交通流量變化情況。這種靈活性使得模型可以根據(jù)實(shí)際情況進(jìn)行調(diào)整,提高預(yù)測的準(zhǔn)確性。假設(shè)交通流量Y與特征X之間存在線性關(guān)系,則可以表示為式(5):
四、測試分析
(一)測試準(zhǔn)備
在收集Y市歷史交通數(shù)據(jù)后,將其分為特征和標(biāo)簽兩部分。特征包含時(shí)間、日期、天氣條件、節(jié)假日、道路類型、車流量等,標(biāo)簽則是每個(gè)時(shí)間段的交通流量是否為高峰時(shí)段,以此使用歷史數(shù)據(jù)對模型進(jìn)行訓(xùn)練。在填充或刪除缺失的交通流量數(shù)據(jù)后,將日期、時(shí)間等非數(shù)值型數(shù)據(jù)轉(zhuǎn)換為數(shù)值型數(shù)據(jù),并對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,以消除不同量綱的影響。最后,使用混淆矩陣評估模型,預(yù)測高峰時(shí)段和非高峰時(shí)段的交通流量時(shí)的性能,計(jì)算準(zhǔn)確度(Accuracy)、精確度(Precision)、召回率(Recall)和 F1 分?jǐn)?shù)(F1 Score)等指標(biāo)。
(二)測試結(jié)果
模型在測試集上的表現(xiàn)詳見表1。根據(jù)模型在測試集上的表現(xiàn),計(jì)算性能指標(biāo)詳見表2。
根據(jù)測試結(jié)果可知,模型在預(yù)測高峰時(shí)段和非高峰時(shí)段的交通流量時(shí)表現(xiàn)良好,準(zhǔn)確度達(dá)到了84%。精確度和召回率分別為83.3%和66.7%,表明模型在預(yù)測交通流量狀態(tài)方面具有較高的準(zhǔn)確性。F1分?jǐn)?shù)為72.7%,證明了模型在精確度和召回率之間能夠取得良好的平衡。上述結(jié)果表明,模型具有一定的實(shí)用價(jià)值,可以為交通管理提供決策支持。
在非實(shí)驗(yàn)環(huán)境中,模型的準(zhǔn)確度為80%左右,仍能夠提供相對可靠的交通流量預(yù)測。精確度保持在80%左右,召回率為60%左右。F1分?jǐn)?shù)保持在70%左右,表明模型在精確度和召回率之間能夠保持較好的平衡。
五、結(jié)束語
通過對手機(jī)信令數(shù)據(jù)進(jìn)行分析和處理,可以獲取城市交通網(wǎng)絡(luò)的時(shí)空特征,為宏觀交通模型的建立提供了重要的數(shù)據(jù)支撐。通過構(gòu)建基于手機(jī)信令數(shù)據(jù)的宏觀交通模型,可以更準(zhǔn)確地模擬和預(yù)測城市交通流量的變化,為交通規(guī)劃和管理提供科學(xué)依據(jù)。然而,信令位置數(shù)據(jù)在宏觀交通模型中的應(yīng)用仍面臨一些挑戰(zhàn)。因此,未來研究可以進(jìn)一步優(yōu)化數(shù)據(jù)處理方法,提高模型預(yù)測的實(shí)時(shí)性,以平衡數(shù)據(jù)利用和用戶應(yīng)急的需求。
作者單位:吳祖康 中國移動(dòng)通信集團(tuán)江蘇有限公司
參考文獻(xiàn)
[1]牛強(qiáng),陳樹林,伍磊.基于手機(jī)App使用大數(shù)據(jù)的居民線上生活空間結(jié)構(gòu)初探——以武漢市都市發(fā)展區(qū)為例[J].地理研究,2024,43(04):966-984.
[2]田釗,張乾鐘,趙軒,等.基于手機(jī)信令數(shù)據(jù)的城市居民動(dòng)態(tài)OD矩陣提取方法[J/OL].鄭州大學(xué)學(xué)報(bào)(工學(xué)版),1-9[2024-04-23].
[3]戴嬌,胡勝,劉宇軒,等.顧及多模態(tài)數(shù)據(jù)特征關(guān)聯(lián)的城市功能區(qū)識別方法——以武漢市為例[J].時(shí)空信息學(xué)報(bào),2024,31(01):74-84.
[4]曾鵬,李玉斌.基于手機(jī)信令數(shù)據(jù)的城鎮(zhèn)網(wǎng)絡(luò)特征及影響因素分析——以天津市武清區(qū)為例[J].城市環(huán)境設(shè)計(jì),2023,(04):266-271.
[5]張凱,湯俊青,段仲淵,等.手機(jī)信令大數(shù)據(jù)在宏觀交通模型中的應(yīng)用研究[J].交通與運(yùn)輸,2023,36(S1):226-231+241.