亚洲免费av电影一区二区三区,日韩爱爱视频,51精品视频一区二区三区,91视频爱爱,日韩欧美在线播放视频,中文字幕少妇AV,亚洲电影中文字幕,久久久久亚洲av成人网址,久久综合视频网站,国产在线不卡免费播放

        ?

        手機(jī)信令的時(shí)空密度軌跡點(diǎn)識(shí)別算法

        2021-03-18 08:03:20略,熊宸,蔡
        計(jì)算機(jī)工程 2021年3期
        關(guān)鍵詞:信令時(shí)空基站

        陳 略,熊 宸,蔡 銘

        (中山大學(xué)智能工程學(xué)院廣東省智能交通系統(tǒng)重點(diǎn)實(shí)驗(yàn)室,廣州 510006)

        0 概述

        近年來(lái),手機(jī)信令作為一種持續(xù)時(shí)間長(zhǎng)、覆蓋范圍廣的新型大數(shù)據(jù)被廣泛用于交通出行行為和規(guī)律的研究。手機(jī)信令數(shù)據(jù)量大、采樣頻率不均、定位精度低以及基站振蕩等問(wèn)題,給其研究帶來(lái)諸多難題。要實(shí)現(xiàn)手機(jī)信令在現(xiàn)實(shí)中的廣泛應(yīng)用,針對(duì)手機(jī)信令數(shù)據(jù)的基礎(chǔ)性研究尤為關(guān)鍵。手機(jī)信令預(yù)處理與軌跡點(diǎn)分析作為手機(jī)信令研究的第一步,其分析結(jié)果是研究用戶出行行為的基礎(chǔ),對(duì)研究用戶出行行為與規(guī)律具有重要意義。

        本文通過(guò)闡述手機(jī)信令特性,總結(jié)現(xiàn)有對(duì)數(shù)據(jù)預(yù)處理與停留點(diǎn)識(shí)別的研究成果,提出一種手機(jī)信令時(shí)空密度軌跡點(diǎn)識(shí)別算法。采用網(wǎng)絡(luò)軌跡時(shí)空聯(lián)結(jié)消除手機(jī)信令的空間不確定性,融合軌跡的曲折性、移動(dòng)時(shí)間和停留時(shí)間重新定義網(wǎng)格簇內(nèi)軌跡點(diǎn)時(shí)空移動(dòng)能力,以網(wǎng)格簇時(shí)空密度為特征識(shí)別停留簇,同時(shí)使用基于簇的時(shí)空關(guān)系漸進(jìn)聚類算法合并時(shí)空鄰近的停留簇,并將其識(shí)別為停留區(qū)域。

        1 相關(guān)工作

        1.1 手機(jī)信令的特性

        手機(jī)信令是一種時(shí)間序列數(shù)據(jù),由基站的經(jīng)緯度和時(shí)間戳構(gòu)成。手機(jī)信令的產(chǎn)生有主動(dòng)產(chǎn)生和被動(dòng)產(chǎn)生兩種方式。主動(dòng)產(chǎn)生方式主要包括用數(shù)據(jù)流量上網(wǎng)、發(fā)短信、打電話等主動(dòng)行為觸發(fā)的基站響應(yīng);被動(dòng)產(chǎn)生方式主要包括收短信、接電話等被動(dòng)行為觸發(fā)的基站響應(yīng)。由于手機(jī)數(shù)據(jù)的產(chǎn)生無(wú)規(guī)律性,因此手機(jī)信令存在采樣頻率不均[1]、軌跡點(diǎn)時(shí)間間隔不規(guī)則以及軌跡點(diǎn)密度分布不均等問(wèn)題。如果以0.5 h 為單位,將一天24 h 劃分為48 個(gè)區(qū)間[2]來(lái)統(tǒng)計(jì)手機(jī)信令軌跡數(shù)據(jù)的區(qū)間數(shù),則一天中未達(dá)到16個(gè)區(qū)間分布的軌跡數(shù)據(jù)視為稀疏數(shù)據(jù)。由于手機(jī)信令采樣頻率不均,在手機(jī)主動(dòng)上網(wǎng)或移動(dòng)的過(guò)程中,手機(jī)信令的采樣間隔最小為1 s,并會(huì)連續(xù)觸發(fā)同一個(gè)位置的基站,造成未經(jīng)預(yù)處理的手機(jī)信令數(shù)據(jù)量大且信息冗余,不適合直接進(jìn)行軌跡點(diǎn)識(shí)別。

        手機(jī)信令相較GPS、卡口數(shù)據(jù)具有更大的空間不確定性,該特性由手機(jī)信令的定位精度和工作機(jī)制所決定。用戶位置一般用其所在基站的位置表示,由于基站覆蓋范圍從幾百米到幾千米不等[3],因此手機(jī)信令精度較差。同時(shí),受手機(jī)信令工作機(jī)制的影響,用戶所在位置實(shí)際連接的基站可能并不是與其最接近的基站,由于某些區(qū)域的基站密度較大,某個(gè)地理位置可能同時(shí)被幾個(gè)基站所覆蓋,因此在該區(qū)域手機(jī)信號(hào)常隨基站信號(hào)強(qiáng)度變化而不斷切換基站,出現(xiàn)乒乓切換現(xiàn)象。一般而言,基站有負(fù)荷優(yōu)化調(diào)節(jié)機(jī)制,當(dāng)鄰近基站用戶負(fù)荷過(guò)大時(shí),會(huì)自動(dòng)切換到更遠(yuǎn)但用戶負(fù)荷較少的基站,從而出現(xiàn)信號(hào)漂移[4]現(xiàn)象。此外,地形起伏、高樓遮擋等因素還會(huì)造成異常切換,從而引起手機(jī)在兩個(gè)或多個(gè)基站之間相互切換的乒乓效應(yīng)或信號(hào)漂移現(xiàn)象。據(jù)文獻(xiàn)[5]統(tǒng)計(jì),出現(xiàn)乒乓切換和信號(hào)漂移的數(shù)據(jù)量約占總數(shù)據(jù)量的30%。

        乒乓切換和信號(hào)漂移并不代表用戶存在真實(shí)的移動(dòng),如果不及時(shí)對(duì)其進(jìn)行處理,會(huì)因高速度和遠(yuǎn)距離的切換或漂移影響停留點(diǎn)聚類,導(dǎo)致產(chǎn)生許多虛假出行數(shù)據(jù)。因此,針對(duì)乒乓切換和信息漂移造成的空間不確定性,研究人員嘗試用速度或距離清洗規(guī)則清除含有該特征的數(shù)據(jù),但由于乒乓切換與信息漂移規(guī)律尚不明確,清洗規(guī)則依據(jù)不足,且清除效果未知,因此通過(guò)清洗來(lái)消除空間不確定性還有待研究。本文采用不同于上述方法的思路,不以清除所有乒乓切換和漂移數(shù)據(jù)為目的,而將軌跡點(diǎn)震蕩特征作為時(shí)空鄰近一簇軌跡點(diǎn)徘徊與潛在停留的標(biāo)志,并將具有這種特征的軌跡點(diǎn)通過(guò)時(shí)空關(guān)系聯(lián)結(jié)為軌跡簇。通過(guò)將震蕩的軌跡點(diǎn)同化為一個(gè)整體,忽略簇中軌跡點(diǎn)的經(jīng)緯度和時(shí)間戳,并在算法中以簇為聚類單元,消除乒乓切換和漂移數(shù)據(jù)產(chǎn)生的空間不確定性。

        手機(jī)信令具有空間不確定性,其除了是軌跡數(shù)據(jù)之外,還是一種典型的時(shí)空數(shù)據(jù)[6-8]。這類軌跡在聚類時(shí)需要同時(shí)考慮時(shí)間和空間兩個(gè)維度,而目前缺乏以時(shí)間和空間兩個(gè)維度度量軌跡點(diǎn)停留屬性強(qiáng)度的指標(biāo),大部分算法仍采用時(shí)空分離的聚類算法,按照先時(shí)間后空間或者先空間后時(shí)間的順序進(jìn)行聚類。本文結(jié)合軌跡點(diǎn)簇內(nèi)部以及前后軌跡簇間的時(shí)間、距離和曲折性定義軌跡簇的移動(dòng)能力,并根據(jù)軌跡簇移動(dòng)能力及其與前后軌跡簇的時(shí)空距離提出軌跡簇時(shí)空密度函數(shù)MAST 來(lái)度量軌跡簇停留屬性的強(qiáng)度,并為停留點(diǎn)識(shí)別提供具體的參照指標(biāo)。

        1.2 手機(jī)信令預(yù)處理

        手機(jī)信令預(yù)處理包括對(duì)時(shí)間連續(xù)的同位置點(diǎn)進(jìn)行合并以減少軌跡量,以及對(duì)原始數(shù)據(jù)中大量乒乓切換數(shù)據(jù)和漂移數(shù)據(jù)進(jìn)行處理,以消除空間不確定性。目前對(duì)乒乓切換數(shù)據(jù)和漂移數(shù)據(jù)的處理[4,9]有分層清洗[10-11]和多階段去噪[1]兩種方式。

        分層清洗是先將噪聲分為乒乓切換數(shù)據(jù)、漂移數(shù)據(jù)等,再針對(duì)各類噪聲的特征制定不同規(guī)則進(jìn)行清洗。乒乓切換數(shù)據(jù)主要有速度規(guī)則[12]和模式規(guī)則[5,13]兩種清洗規(guī)則。速度規(guī)則為:若基站之間存在ABA 切換形式,且基站間速度超過(guò)一定閾值,則認(rèn)為是乒乓切換,可按照一定規(guī)則清除。在模式規(guī)則方面,文獻(xiàn)[11]通過(guò)定義乒乓切換形式,設(shè)定在基站間切換的模式,若檢測(cè)到該模式則進(jìn)行清除。文獻(xiàn)[14]中結(jié)合速度規(guī)則和模式規(guī)則的乒乓切換清洗也較常見(jiàn)。對(duì)于漂移數(shù)據(jù),通常認(rèn)為其在短時(shí)間內(nèi)與前后兩個(gè)軌跡點(diǎn)相距較遠(yuǎn),一般采用設(shè)定中間軌跡點(diǎn)與前后軌跡點(diǎn)間的速度來(lái)檢測(cè)漂移數(shù)據(jù)[10],如果速度超過(guò)閾值,則認(rèn)為是漂移數(shù)據(jù);或者檢測(cè)漂移點(diǎn)與前后軌跡點(diǎn)形成的角度,通過(guò)設(shè)置角度閾值來(lái)清洗漂移數(shù)據(jù)[11]。

        多階段去噪是將乒乓切換數(shù)據(jù)和漂移數(shù)據(jù)導(dǎo)致的偏差視為由移動(dòng)通信機(jī)制和采集系統(tǒng)故障引起的系統(tǒng)誤差,這種誤差難以用數(shù)學(xué)工具來(lái)描述,即無(wú)法用任何隨機(jī)分布形式來(lái)模擬和表達(dá),但可將其在二維上表現(xiàn)為離群點(diǎn),采用離群點(diǎn)檢測(cè)算法進(jìn)行處理[1]。與制定多種檢測(cè)規(guī)則來(lái)清洗數(shù)據(jù)的分層清洗不同,多階段去噪是將乒乓切換數(shù)據(jù)與漂移數(shù)據(jù)統(tǒng)一視為離群點(diǎn)進(jìn)行處理。實(shí)際上,由于乒乓切換和漂移效應(yīng)的形式具有多樣性,且目前乒乓切換數(shù)據(jù)與漂移數(shù)據(jù)的內(nèi)在規(guī)律尚不明確,因此無(wú)法評(píng)價(jià)清洗的有效性。文獻(xiàn)[15]借鑒貪婪算法思想根據(jù)位置出現(xiàn)頻率提出時(shí)空貪婪同化算法,尋找短時(shí)間內(nèi)該位置點(diǎn)之間夾雜的其他位置點(diǎn)并形成集合,以實(shí)現(xiàn)位置點(diǎn)同化,從而消除空間不確定性,錨固長(zhǎng)時(shí)間停留點(diǎn)的位置。但是僅按照頻率自上而下合并,缺乏對(duì)于不同時(shí)間段的同一位置點(diǎn)(手機(jī)信令時(shí)間序列性)的考慮,容易將某些經(jīng)常移動(dòng)的點(diǎn)識(shí)別為停留點(diǎn)從而打亂軌跡序列。

        消除空間不確定性在聚類中表現(xiàn)為受到噪聲點(diǎn)的影響較小。由各種消除空間不確定性的算法可知:清洗思想以軌跡點(diǎn)為研究單元,通過(guò)劃分時(shí)間閾值和距離閾值進(jìn)行聚類,易被乒乓切換噪聲點(diǎn)及漂移噪聲點(diǎn)割裂為幾個(gè)小簇;同化思想是將有震蕩和徘徊等潛在停留特征的軌跡點(diǎn)同化為簇,并以簇為研究單元在軌跡簇之間進(jìn)行聚類,受噪聲影響較少。

        由上述可知,同化算法更適合應(yīng)用于噪聲多、精度低以及復(fù)雜度大的手機(jī)信令數(shù)據(jù)。針對(duì)現(xiàn)有同化算法未考慮手機(jī)信令時(shí)間序列性,將高頻率位置點(diǎn)間夾雜的低頻率位置點(diǎn)歸為一簇,并將所有時(shí)刻的該位置點(diǎn)歸于其軌跡簇而忽視軌跡復(fù)雜性等問(wèn)題,本文根據(jù)乒乓切換和數(shù)據(jù)漂移共有的震蕩特征及交通出行時(shí)間的定義,設(shè)計(jì)在一定時(shí)間內(nèi)空間鄰近位置點(diǎn)及其夾雜的位置點(diǎn)互相環(huán)扣進(jìn)行交織聯(lián)結(jié)的時(shí)空聯(lián)結(jié)流程,同時(shí)兼顧軌跡的時(shí)序性與時(shí)空緊密性。

        1.3 停留點(diǎn)識(shí)別

        停留點(diǎn)是一次出行的起訖點(diǎn),其通常被定義為有目的的活動(dòng)地點(diǎn),且該地點(diǎn)的停留時(shí)間超過(guò)5 min。由于停留時(shí)間需要連續(xù)的空間累積,因此停留點(diǎn)的識(shí)別算法包括基于距離、時(shí)間、形狀和密度的聚類算法。

        基于距離的聚類算法[16-17]基于手機(jī)信令采樣頻率不固定的特征,通過(guò)相鄰軌跡點(diǎn)間的距離來(lái)反映用戶出行情況,以代替用相鄰軌跡點(diǎn)間的時(shí)間差作為停留時(shí)間來(lái)判斷用戶是否停留。因此,可根據(jù)前一個(gè)軌跡點(diǎn)的移動(dòng)或停留狀態(tài),以及前一個(gè)軌跡點(diǎn)與當(dāng)前軌跡點(diǎn)的距離與時(shí)間差判斷當(dāng)前軌跡點(diǎn)的狀態(tài)。但這種基于距離的算法易受到漂移點(diǎn)和前一個(gè)軌跡點(diǎn)狀態(tài)判斷錯(cuò)誤的影響。此外,距離閾值和時(shí)間閾值的設(shè)定對(duì)聚類結(jié)果也有較大影響。

        基于時(shí)間的聚類算法[18]沿時(shí)間軸將距離小于閾值的軌跡點(diǎn)聚類成簇,并通過(guò)判斷簇的停留時(shí)間來(lái)識(shí)別是否為停留區(qū)域?;跁r(shí)間的聚類算法易受漂移點(diǎn)和震蕩點(diǎn)影響,從而將停留區(qū)域切分為多個(gè)小簇,且由于沿時(shí)間軸進(jìn)行聚類,會(huì)將真正引起簇內(nèi)距離過(guò)大的時(shí)間軸靠前的軌跡點(diǎn)納入簇中,造成簇的劃分錯(cuò)誤。因此,時(shí)間閾值和距離閾值的選取在很大程度上會(huì)影響聚類劃分結(jié)果。

        基于軌跡形狀[11]用定義的最小覆蓋圓沿時(shí)間軸將軌跡點(diǎn)劃分到簇中,當(dāng)軌跡點(diǎn)超過(guò)最小覆蓋圓時(shí)判斷簇的停留時(shí)間,若大于停留時(shí)間閾值則判斷為停留簇,若小于停留時(shí)間閾值則排除簇中時(shí)間軸最靠前的軌跡點(diǎn),并從簇中第二個(gè)軌跡點(diǎn)開(kāi)始循環(huán)?;谛螤畹木垲愃惴ú皇芫垲愴樞虻挠绊懀^基于時(shí)間聚類的算法能更有效地劃分距離近的簇,但容易受到噪聲影響而分為多個(gè)小簇,且該算法受停留時(shí)間閾值的影響較大。

        DBSCAN 等基于密度的聚類算法根據(jù)手機(jī)信令的時(shí)間序列性,將Eps 空間鄰域拓展到時(shí)間維度[10,19-20]。時(shí)空密度被定義為時(shí)空閾值范圍內(nèi)的軌跡點(diǎn)個(gè)數(shù),對(duì)于采樣頻率不均的手機(jī)信令數(shù)據(jù)而言,不能將軌跡個(gè)數(shù)作為時(shí)空密度的度量標(biāo)準(zhǔn),加上密度聚類參數(shù)選取困難,當(dāng)采樣頻率不均時(shí),聚類質(zhì)量較差。

        目前軌跡聚類算法存在以下問(wèn)題:

        1)對(duì)停留點(diǎn)構(gòu)建指標(biāo)的判斷未結(jié)合時(shí)空兩方面屬性,只能定性判斷軌跡點(diǎn)停留與否,無(wú)法定量反映軌跡點(diǎn)停留屬性的大小。

        2)僅將軌跡作為線性曲線處理,未考慮軌跡形狀、曲折性等其他復(fù)雜的特性。

        3)對(duì)于時(shí)間、距離、個(gè)數(shù)等聚類算法的閾值采取統(tǒng)一方式,未兼顧不同用戶的出行特征。

        針對(duì)上述問(wèn)題,本文提出解決方案如下:

        1)定義了融合時(shí)空特性的時(shí)空密度函數(shù)MAST指標(biāo),其用來(lái)度量軌跡簇中軌跡點(diǎn)的時(shí)空密度,并定量反映軌跡點(diǎn)停留屬性的強(qiáng)度。

        2)根據(jù)軌跡簇的曲折性以及移動(dòng)時(shí)間和停留時(shí)間比例定義簇的移動(dòng)能力,并作為軌跡特性融合到時(shí)空密度函數(shù)計(jì)算中。

        3)不同于聚類算法中的閾值設(shè)置方法,本文根據(jù)時(shí)空密度函數(shù)MAST 的概率密度分布特征,自動(dòng)劃分符合個(gè)人移動(dòng)特征的停留點(diǎn)密度閾值,避免了手動(dòng)設(shè)置閾值不適用于全局?jǐn)?shù)據(jù)的問(wèn)題。

        2 本文算法

        本文提出基于時(shí)空聯(lián)結(jié)移動(dòng)能力的軌跡點(diǎn)識(shí)別算法,其流程如圖1 所示。

        圖1 本文算法流程Fig.1 Procedure of the proposed algorithm

        2.1 軌跡點(diǎn)網(wǎng)格化

        為便于統(tǒng)一算法評(píng)估尺度與簡(jiǎn)化計(jì)算量,將研究區(qū)域網(wǎng)格化,并將基站的經(jīng)緯度歸入網(wǎng)格中,以網(wǎng)格序號(hào)代替。例如,將第i條記錄軌跡點(diǎn)基站的經(jīng)緯度(i,lngi,lati,ti)替換為網(wǎng)格坐標(biāo)(i,xi,yi,ti)。

        將研究區(qū)域網(wǎng)格化后,對(duì)連續(xù)的同網(wǎng)格軌跡點(diǎn)記錄進(jìn)行合并,只保留第一條和最后一條。例如,序列{(i,x,y,ti),(i+1,x,y,ti+1),…,(j,x,y,tj)}簡(jiǎn)化為{(i,x,y,ti),(j,x,y,tj)}。連續(xù)的網(wǎng)格軌跡點(diǎn)記錄合并后成為前后兩條相同網(wǎng)格的時(shí)間戳記錄,由此可以明確在此兩個(gè)時(shí)間戳及其之間時(shí)段內(nèi)該網(wǎng)格的停留時(shí)間,并將該網(wǎng)格視為停留網(wǎng)格。由于部分網(wǎng)格無(wú)連續(xù)軌跡點(diǎn)記錄,只有單個(gè)網(wǎng)格的時(shí)間戳,因此將此類網(wǎng)格視為單網(wǎng)格,無(wú)法知道該網(wǎng)格的停留時(shí)間。

        2.2 網(wǎng)格軌跡時(shí)空聯(lián)結(jié)

        本文時(shí)空聯(lián)結(jié)的思想是基于手機(jī)信令的振蕩噪聲及其停留與徘徊的特點(diǎn):從起點(diǎn)切換到某地再回到起點(diǎn)附近的過(guò)程如果發(fā)生在短時(shí)間內(nèi),那么這段時(shí)間用戶實(shí)際并未出行,僅在起點(diǎn)和切換點(diǎn)之間的某處?kù)o止或小范圍地運(yùn)動(dòng)。由各城市居民出行的調(diào)查結(jié)果可知,一次出行的耗時(shí)通常大于5 min,其中在出行目的地的耗時(shí)超過(guò)5 min。由于從某地點(diǎn)出發(fā)再返回該地點(diǎn)附近的過(guò)程涉及一個(gè)活動(dòng)和兩次出行[15],因此該過(guò)程的最小時(shí)間間隔為15 min。

        算法1網(wǎng)格軌跡時(shí)空聯(lián)結(jié)算法

        上述算法具體步驟如下:

        1)假設(shè)網(wǎng)格化后軌跡數(shù)據(jù)集為D,cluster 為標(biāo)識(shí)的網(wǎng)格記錄集合,del_cluster 為待循環(huán)刪除的網(wǎng)格記錄集合,Cm 為所有網(wǎng)格簇集合,當(dāng)前軌跡點(diǎn)記錄(i,xi,yi,ti)∈cluster。

        2)按時(shí)間序列輸入當(dāng)前軌跡點(diǎn)記錄(i,xi,yi,ti),若下一條記錄(i+1,xi+1,yi+1,ti+1)為相鄰網(wǎng)格,則xi+1∈[xi-1,xi+1]且yi+1∈[yi-1,yi+1]。若(i+1,xi+1,yi+1,ti+1)不在cluster 中,則將下一條記錄(i+1,xi+1,yi+1,ti+1)加入簇和del_cluster中,當(dāng)前記錄變?yōu)橄乱粭l記錄(i+1,xi+1,yi+1,ti+1),即i=i+1,然后再?gòu)牟襟E2 開(kāi)始;否則轉(zhuǎn)到步驟4。若下一條記錄所在網(wǎng)格與當(dāng)前網(wǎng)格不相鄰,則轉(zhuǎn)到步驟3。

        3)檢測(cè)ti<t<ti+15 min 時(shí)間范圍內(nèi)是否有與當(dāng)前軌跡點(diǎn)網(wǎng)格相鄰的記錄,即xi+1∈[xi-1,xi+1]且yi+1∈[yi-1,yi+1],將與當(dāng)前軌跡點(diǎn)網(wǎng)格相鄰的記錄集合記為cf。如果該時(shí)間段內(nèi)存在相鄰網(wǎng)格記錄,即length(cf)>0,則檢測(cè)相鄰網(wǎng)格記錄是否存在不屬于cluster 的軌跡記錄,并將其記為ss,如果存在該軌跡記錄,即length(ss)>0,則將這部分不屬于cluster的相鄰網(wǎng)格軌跡記錄及其時(shí)間范圍內(nèi)所有不屬于cluster 的軌跡記錄全部加入cluster 和del_cluster,當(dāng)前記錄轉(zhuǎn)為cluster 中最后一條記錄,即i=cluster[-1].order number。若不存在不屬于cluster 的軌跡記錄,則轉(zhuǎn)到步驟4,執(zhí)行算法2;若ti<t<ti+15 min 時(shí)段內(nèi)沒(méi)有與當(dāng)前軌跡點(diǎn)網(wǎng)格相鄰的記錄,即length(cf)=0,則轉(zhuǎn)到步驟4,執(zhí)行算法2。

        4)刪除del_cluster 中所有與當(dāng)前軌跡網(wǎng)格序號(hào)相同(x=xi且y=yi)的記錄,若del_cluster 仍不為空,則按時(shí)間排序,當(dāng)前軌跡記錄跳轉(zhuǎn)到del_cluster 中時(shí)間排序最后的軌跡記錄,即i=del_cluster[-1].order number(見(jiàn)算法2 中步驟1~步驟3)。若刪除當(dāng)前軌跡記錄所在網(wǎng)格后del_cluster 為空,則轉(zhuǎn)向步驟5。

        5)將cluster 中網(wǎng)格軌跡記錄標(biāo)記為潛在的停留簇,并將cluster 加入Cm,當(dāng)前記錄跳轉(zhuǎn)到cluster 中最后一條記錄的下一條,即i=cluster[-1].order number+1(見(jiàn)算法2 中步驟5~步驟6)。

        算法2刪除與循環(huán)聯(lián)結(jié)算法

        算法2 是網(wǎng)格軌跡時(shí)空聯(lián)結(jié)算法的子算法,其執(zhí)行的是算法1 中在當(dāng)前軌跡點(diǎn)不能再向后聯(lián)結(jié)軌跡點(diǎn)的情況下,在簇軌跡點(diǎn)中從后向前尋找能繼續(xù)沿時(shí)間序列向后聯(lián)結(jié)的軌跡點(diǎn)作為當(dāng)前軌跡點(diǎn)的過(guò)程。若簇內(nèi)沒(méi)有可以繼續(xù)向后聯(lián)結(jié)的軌跡點(diǎn),則結(jié)束該簇聯(lián)結(jié)流程,并將簇加入到Cm 中。算法2 的具體步驟為:在當(dāng)前軌跡點(diǎn)與下一個(gè)軌跡點(diǎn)的網(wǎng)格位置不相鄰,且當(dāng)前軌跡點(diǎn)時(shí)間戳后的15 min 內(nèi)無(wú)相鄰網(wǎng)格可以聯(lián)結(jié)情況下,刪除del_cluster 簇中全部當(dāng)前網(wǎng)格序號(hào)的軌跡點(diǎn),并在簇del_cluster 剩余的網(wǎng)格軌跡點(diǎn)中選擇時(shí)間戳最后的軌跡網(wǎng)格作為當(dāng)前網(wǎng)格,繼續(xù)對(duì)該簇循環(huán)執(zhí)行算法1 的聯(lián)結(jié)流程。如果刪除后del_cluster 為空,無(wú)法再向后聯(lián)結(jié),則結(jié)束該簇的聯(lián)結(jié)流程,將簇cluster 添加到Cm 集合中,向后聯(lián)結(jié)下一簇。

        在時(shí)空聯(lián)結(jié)的簇中,停留網(wǎng)格記錄需成對(duì)出現(xiàn)。通過(guò)時(shí)空聯(lián)結(jié)的循環(huán)流程,可按照時(shí)間序列將一定時(shí)段和地理范圍內(nèi)停留或徘徊交織的軌跡點(diǎn)簇聯(lián)結(jié)為網(wǎng)格簇。時(shí)空聯(lián)結(jié)流程偽代碼見(jiàn)算法1 和算法2。經(jīng)過(guò)時(shí)空聯(lián)結(jié),網(wǎng)格主要有單網(wǎng)格、停留雙網(wǎng)格以及網(wǎng)格簇3 種類型。

        2.3 網(wǎng)格時(shí)空密度

        本文參考文獻(xiàn)[21-22]中密度的定義提出一種新的時(shí)空密度函數(shù)MAST,根據(jù)軌跡段的移動(dòng)曲線特征并結(jié)合距離和時(shí)間分布情況,定義網(wǎng)格簇的移動(dòng)能力和網(wǎng)格簇的時(shí)空密度,以體現(xiàn)出信令的時(shí)空特性與時(shí)間序列性。

        圖2為兩種軌跡的移動(dòng)情形??梢钥闯鲈谕粋€(gè)起始點(diǎn)和目的地的軌跡段中,移動(dòng)的軌跡偏向進(jìn)行直線運(yùn)動(dòng)(見(jiàn)軌跡1),而停留或徘徊的軌跡更偏向進(jìn)行曲線運(yùn)動(dòng)(見(jiàn)軌跡2)。文獻(xiàn)[21]根據(jù)圖2 提出移動(dòng)能力的概念,基于此,下文對(duì)直線距離和曲線距離進(jìn)行定義。

        圖2 兩種軌跡移動(dòng)情形Fig.2 Two cases of track movement

        定義1(直線距離)存在n-m+1 個(gè)點(diǎn)的軌跡段Traji={pm,pm+1,…,pn},Traji的直線距離為軌跡段起點(diǎn)pm和終點(diǎn)pn之間的直線距離,其表達(dá)式如下:

        定義2(曲線距離)存在n-m+1 個(gè)點(diǎn)的軌跡段Traji={pm,pm+1,…,pn},Traji的曲線距離為各子軌跡段的距離之和,其表達(dá)式如下:

        移動(dòng)能力被定義為直線距離和曲線距離的比值[21],其表達(dá)式如下:

        文獻(xiàn)[21]對(duì)MA 的定義僅考慮整個(gè)軌跡段的曲折性,而長(zhǎng)時(shí)間在職住地或者基站覆蓋范圍較大的區(qū)域停留時(shí),與其他基站的切換較少但停留時(shí)間較長(zhǎng),如果只考慮曲折性,那么在停留區(qū)域位置不變的點(diǎn)的移動(dòng)能力為1,其移動(dòng)能力反而會(huì)異常大。因此,本文綜合考慮軌跡的曲折性、移動(dòng)時(shí)間和停留時(shí)間后,對(duì)網(wǎng)格時(shí)空移動(dòng)能力進(jìn)行重新定義。文獻(xiàn)[21]針對(duì)核心點(diǎn)通過(guò)該點(diǎn)所在軌跡段的MA 及其周圍網(wǎng)絡(luò)接入點(diǎn)(Nap)對(duì)其產(chǎn)生的影響來(lái)定義,但其利用周圍軌跡點(diǎn)個(gè)數(shù)劃定移動(dòng)能力的計(jì)算范圍不適用于采樣頻率不均的手機(jī)信令數(shù)據(jù)。文獻(xiàn)[22]基于軌跡點(diǎn)鄰域半徑R內(nèi)包含所有軌跡段的最小值對(duì)軌跡點(diǎn)的移動(dòng)能力進(jìn)行定義,其劃定鄰域半徑R作為軌跡點(diǎn)移動(dòng)能力計(jì)算范圍,但對(duì)于存在乒乓切換和信號(hào)漂移的手機(jī)信令而言,鄰域半徑R將軌跡的時(shí)間序列切割為多個(gè)軌跡段,而移動(dòng)能力最小的軌跡段不能有效反映該連續(xù)時(shí)間序列的軌跡段移動(dòng)能力。

        本文網(wǎng)格軌跡N經(jīng)過(guò)時(shí)空聯(lián)結(jié)后形成網(wǎng)格簇序列{Traj1,Traj2,…,Trajf}(f為聯(lián)結(jié)后的網(wǎng)格簇總數(shù))。每個(gè)網(wǎng)格簇的移動(dòng)能力通過(guò)自身軌跡與該網(wǎng)格簇和前后網(wǎng)格簇之間轉(zhuǎn)移軌跡的影響,以及網(wǎng)格簇內(nèi)的軌跡來(lái)定義。假設(shè)網(wǎng)格簇自身軌跡為Traji={pm,pm+1,…,pn},該網(wǎng)格簇與前后網(wǎng)格簇之間轉(zhuǎn)移軌跡為dis(pm-1,pm)與dis(pn,pn+1)之和,轉(zhuǎn)移時(shí)間為travel time(pm-1,pm)與travel time(pn,pn+1)之和,網(wǎng)格簇總時(shí)間為移動(dòng)時(shí)間與停留時(shí)間之和。

        定義3(網(wǎng)格簇移動(dòng)時(shí)間)網(wǎng)格簇移動(dòng)時(shí)間是當(dāng)前網(wǎng)格簇Traji={pm,pm+1,…,pn}與前后網(wǎng)格簇轉(zhuǎn)移時(shí)間以及網(wǎng)格簇內(nèi)單網(wǎng)格與單網(wǎng)格、單網(wǎng)格與停留網(wǎng)格的轉(zhuǎn)移時(shí)間之和,計(jì)算公式如下:

        其中,v為當(dāng)前網(wǎng)格簇內(nèi)單網(wǎng)格與停留網(wǎng)格的總個(gè)數(shù)。

        定義4(網(wǎng)格簇總時(shí)間)網(wǎng)格簇總時(shí)間是從網(wǎng)格簇Traji={pm,pm+1,…,pn}的前一點(diǎn)pm-1到網(wǎng)格簇的后一點(diǎn)pn+1所經(jīng)歷的時(shí)間,計(jì)算公式如下:

        定義5(網(wǎng)格移動(dòng)能力)網(wǎng)格移動(dòng)能力是前后網(wǎng)格簇和當(dāng)前網(wǎng)格簇的轉(zhuǎn)移軌跡與當(dāng)前網(wǎng)格簇內(nèi)軌跡自身曲折性和移動(dòng)時(shí)間比例的乘積,計(jì)算公式如下:

        由式(6)可知:軌跡起始點(diǎn)與目的地之間軌跡越曲折,則網(wǎng)格移動(dòng)能力MA 越?。徽麄€(gè)軌跡運(yùn)動(dòng)中移動(dòng)時(shí)間占總時(shí)間比例越小,則網(wǎng)格移動(dòng)能力MA 也越小,與經(jīng)驗(yàn)認(rèn)知相符。

        根據(jù)數(shù)據(jù)域理論,空間中每個(gè)數(shù)據(jù)點(diǎn)都會(huì)受其周圍數(shù)據(jù)點(diǎn)的影響,且該影響隨距離的增加而減弱。由于軌跡停留區(qū)域內(nèi)數(shù)據(jù)點(diǎn)聚集程度明顯高于移動(dòng)區(qū)域內(nèi)數(shù)據(jù)點(diǎn),因此停留區(qū)域內(nèi)每個(gè)點(diǎn)所受影響也高于移動(dòng)區(qū)域內(nèi)數(shù)據(jù)點(diǎn)[22]。與以軌跡點(diǎn)為研究單元,并以軌跡點(diǎn)與其周圍軌跡點(diǎn)間的影響定義軌跡點(diǎn)密度不同,本文以網(wǎng)格簇軌跡為研究單元,結(jié)合數(shù)據(jù)域理論,通過(guò)時(shí)間序列前后網(wǎng)格簇及網(wǎng)格簇自身影響定義網(wǎng)格簇時(shí)空密度函數(shù)MAST,計(jì)算公式如下:

        其中,σMA和σdis分別為移動(dòng)能力權(quán)重函數(shù)和距離權(quán)重函數(shù)的標(biāo)準(zhǔn)偏差,ST(pk)=tk+1-tk為網(wǎng)格簇轉(zhuǎn)移軌跡與簇內(nèi)軌跡網(wǎng)格間的停留時(shí)間。

        由式(7)可知:網(wǎng)格軌跡移動(dòng)能力MA 越小,則網(wǎng)格間距離越小,停留時(shí)間越長(zhǎng);網(wǎng)格簇時(shí)空密度函數(shù)MAST 越大,則其為停留簇的可能性越大。與以往時(shí)空密度的定義不同[21-22],本文以網(wǎng)格簇為對(duì)象,利用時(shí)空聯(lián)結(jié)形成網(wǎng)格簇來(lái)實(shí)現(xiàn)簇內(nèi)軌跡的時(shí)空連貫性,同時(shí)簇與簇之間的轉(zhuǎn)移距離與轉(zhuǎn)移時(shí)間進(jìn)一步保證手機(jī)信令的時(shí)間序列性不被空間鄰域半徑所割裂,并與軌跡曲折性相結(jié)合,充分應(yīng)用手機(jī)信令特性,增強(qiáng)了時(shí)空密度判斷的合理性。

        通常采用速度來(lái)判斷是否為移動(dòng)和停留狀態(tài),但是由于手機(jī)信令的固有特性,用戶定位基站并不代表用戶的實(shí)際位置,且基站覆蓋范圍較廣,存在覆蓋區(qū)域相互重疊的情況,因此基站內(nèi)停留時(shí)間較實(shí)際時(shí)間偏大,基站間轉(zhuǎn)移時(shí)間較實(shí)際時(shí)間偏小,從而造成基站間移動(dòng)速度較實(shí)際速度偏大。同時(shí),因?yàn)榇嬖谠肼暎古仪袚Q和信息漂移的速度均較大,所以速度波動(dòng)幅度較大。將各網(wǎng)格簇的平均移動(dòng)速度與其時(shí)空密度函數(shù)值進(jìn)行對(duì)比,結(jié)果如圖3 所示。

        圖3 網(wǎng)格簇的平均移動(dòng)速度和時(shí)空密度Fig.3 Average moving speed and space-time density of grid clusters

        由圖3 可以看出:移動(dòng)速度大的區(qū)域與許多速度小的區(qū)域交織,說(shuō)明移動(dòng)過(guò)程中存在個(gè)別減速或擁堵時(shí)段;網(wǎng)格簇的移動(dòng)速度與時(shí)空密度的變化相反,移動(dòng)速度大的網(wǎng)格簇時(shí)空密度小,而移動(dòng)速度小的網(wǎng)格簇時(shí)空密度大,說(shuō)明時(shí)空密度能夠反映移動(dòng)和停留的特性;時(shí)空密度較移動(dòng)速度更穩(wěn)定,對(duì)移動(dòng)和停留更有區(qū)分性,因此其更適合作為判斷移動(dòng)和停留狀態(tài)的指標(biāo)。

        時(shí)空密度函數(shù)參數(shù)包括密度函數(shù)中的σMA、σdis以及時(shí)空密度函數(shù)MAST 的最小密度閾值。對(duì)于σMA和σdis的選取,本文通過(guò)自行開(kāi)發(fā)的基站采集APP 采集真實(shí)手機(jī)信令軌跡數(shù)據(jù)來(lái)驗(yàn)證參數(shù)選取的可靠性。將不同的σMA和σdis進(jìn)行組合計(jì)算得到各網(wǎng)格簇的時(shí)空密度函數(shù)MAST,通過(guò)其數(shù)據(jù)概率密度分布自動(dòng)確定最小密度閾值,篩選得到大于時(shí)空密度函數(shù)MAST 的最小密度閾值的網(wǎng)格簇個(gè)數(shù),對(duì)比不同σMA和σdis組合下停留簇的變化情況,結(jié)果如圖4 所示。

        圖4 不同σMA和σdis組合下網(wǎng)格簇時(shí)空密度的概率密度分布Fig.4 Probability density distribution of space-time density of grid clusters with different combinations of σMAand σdis

        由圖4 可以看出,σMA的取值為0.1~0.9,σdis的取值為0.5~50,不同σMA和σdis組合下網(wǎng)格簇的MAST 的概率密度分布基本相同。由此可知,σMA和σdis的取值對(duì)MAST 的概率密度分布影響較小,且σMA對(duì)MAST 的影響大于σdis。此外,MAST 概率密度分布曲線有兩個(gè)峰值,較大峰值為用戶職住地的時(shí)空密度,較小峰值包含移動(dòng)簇和短時(shí)間的停留簇。根據(jù)經(jīng)驗(yàn)可知,用戶在工作地和居住地的活動(dòng)時(shí)間通常占一天內(nèi)大部分時(shí)間,其時(shí)空密度遠(yuǎn)大于移動(dòng)點(diǎn)與短時(shí)間停留區(qū)域,因此兩個(gè)峰值之間存在一段MAST=0 的分布。因此,可先采用K-means 算法將MAST 聚類為職住地、常規(guī)移動(dòng)點(diǎn)和停留點(diǎn)兩大類,再將MAST 密度小的一類(常規(guī)移動(dòng)點(diǎn)和停留點(diǎn))用K-means 算法再聚類為兩類,將這兩類的分界值作為MAST 最小密度閾值以區(qū)分移動(dòng)簇和停留簇。綜上所述,將MAST 用K-means 算法聚類為A、B、C和D 4類,不同σMA和σdis組合下MAST的聚類效果如圖5 所示(彩色效果參見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML 版)。

        圖5 不同σMA和σdis組合下網(wǎng)格簇時(shí)空密度的K-means 聚類分布Fig.5 K-means clustering distribution of grid cluster space-time density under different combinations of σMAand σdis

        由圖5 可以看出,在不同σMA和σdis組合下網(wǎng)格簇MAST 的K-means 聚類分布中,移動(dòng)簇和停留簇的分布基本相同,均識(shí)別出7 個(gè)停留區(qū)域,說(shuō)明參數(shù)σMA和σdis的選取對(duì)停留區(qū)域的識(shí)別影響較小,通過(guò)K-means 聚類算法自動(dòng)選取MAST 閾值得到的識(shí)別結(jié)果具有較好的穩(wěn)定性。

        2.4 網(wǎng)格簇時(shí)空聚類

        從網(wǎng)格簇中識(shí)別出移動(dòng)簇與停留簇后,將時(shí)空距離較近的簇進(jìn)行時(shí)空聚類,以錨固停留區(qū)域并避免停留區(qū)域被噪聲分割。

        根據(jù)停留和出行的定義,一次停留時(shí)間需大于5 min,一次出行時(shí)間需大于5 min 且出行距離大于500 m。本文定義一次出行起訖點(diǎn)簇最小覆蓋圓的圓心距離需大于500 m 且兩圓相離,設(shè)計(jì)時(shí)空聚類流程如下:

        1)計(jì)算各停留簇最小覆蓋圓的圓心c、半徑r以及簇停留時(shí)間st=tn-tm,即Traji={pm,pm+1,…,pn}中軌跡點(diǎn)首尾時(shí)間戳的差值。

        2)若當(dāng)前停留簇Traji={pm,pm+1,…,pn}與下一個(gè)停留簇Traji+1={px,px+1,…,py}首尾時(shí)間間隔tx-tn>5 min,當(dāng)前停留簇Traji最小覆蓋圓與下一個(gè)停留簇Traji+1最小覆蓋圓相離,且其圓心ci與ci+1的距離大于500 m,滿足出行條件,則轉(zhuǎn)到步驟3;否則轉(zhuǎn)到步驟5。

        3)若當(dāng)前停留簇Traji的停留時(shí)間st(i)>5 min,滿足停留條件,則將停留簇Traji標(biāo)記為停留區(qū)域,下一個(gè)停留簇成為當(dāng)前停留簇;否則轉(zhuǎn)到步驟4。

        4)若當(dāng)前停留簇Traji的停留時(shí)間不滿足停留條件,則將該停留簇標(biāo)記為延誤區(qū)域。

        5)將下一個(gè)停留簇Traji+1加入當(dāng)前停留簇Traji,合成Traji={pm,pm+1,…,pn,px,px+1,…,py},重新計(jì)算最小覆蓋圓的圓心ci、半徑ri以及簇停留時(shí)間st(i),轉(zhuǎn)到步驟2。

        本文提出的網(wǎng)格簇時(shí)空聚類算法,考慮了停留簇之間時(shí)間間隔與空間的關(guān)系,是一種漸進(jìn)的聚類算法[23]。該算法將一定區(qū)域的小空間簇進(jìn)行聚合有利于錨固有意義的停留區(qū)域。

        3 算例與結(jié)果分析

        本文采用自行開(kāi)發(fā)的基站采集APP 采集志愿者的軌跡數(shù)據(jù)(包括時(shí)間戳、基站經(jīng)緯度、移動(dòng)或停留標(biāo)簽數(shù)據(jù))以驗(yàn)證算法的識(shí)別效果。基站采集頻率設(shè)置為5 s 采集一次(由于各品牌手機(jī)硬件不同,因此,實(shí)際采集頻率大于該值)。記錄志愿者一天24 h 的軌跡數(shù)據(jù),得到10 582 條數(shù)據(jù),其中包括5 個(gè)停留區(qū)域與3 次交通換乘記錄,由于換乘時(shí)間均大于5 min,因此3 個(gè)換乘站點(diǎn)在軌跡識(shí)別結(jié)果中均視為停留區(qū)域。將10 582 條記錄進(jìn)行網(wǎng)格化,并與同網(wǎng)格數(shù)據(jù)合并,只保留首尾兩條數(shù)據(jù),將數(shù)據(jù)簡(jiǎn)化為846 條,并通過(guò)時(shí)空聯(lián)結(jié)操作將846 條網(wǎng)格數(shù)據(jù)劃分為時(shí)空緊密相連的144 簇。表1 為時(shí)空聯(lián)結(jié)生成的網(wǎng)格簇軌跡記錄。以簇2 為例,將序號(hào)4 和序號(hào)5 記為組1,序號(hào)7 和序號(hào)8 記為組2,序號(hào)6 記為組3,序號(hào)9 和序號(hào)10 記為組4,組1 和組2、組3 和組4 分別表示簇2 內(nèi)兩個(gè)地理位置相同和兩個(gè)地理位置相鄰且時(shí)間間隔小于15 min 的網(wǎng)格簇軌跡記錄,上述各組區(qū)域相互交織,共同形成簇2。

        表1 時(shí)空聯(lián)結(jié)生成的網(wǎng)格簇軌跡記錄Table 1 Track record of grid clusters generated by space-time connections

        從空間識(shí)別有效性和時(shí)間識(shí)別有效性將本文算法與改進(jìn)DBSCAN 時(shí)空密度算法[21](以下稱為文獻(xiàn)[21]算法)得到的停留點(diǎn)識(shí)別結(jié)果進(jìn)行對(duì)比,采用停留點(diǎn)個(gè)數(shù)、停留時(shí)間的準(zhǔn)確率P、召回率R以及準(zhǔn)確率和召回率的加權(quán)平均值F1 來(lái)評(píng)價(jià)本文方法的有效性,并通過(guò)對(duì)比兩種算法的耗時(shí)以評(píng)價(jià)算法效率。文獻(xiàn)[21]算法參數(shù)設(shè)置為:σMA=0.5,σdis=0.5,Nap=51。本文算法參數(shù)設(shè)置為:σMA=0.5,σdis=0.5。兩種算法得到的停留點(diǎn)識(shí)別結(jié)果如表2 所示??梢钥闯觯何墨I(xiàn)[21]算法檢測(cè)到的停留區(qū)域個(gè)數(shù)在準(zhǔn)確率和召回率上均明顯低于本文算法,本文算法在空間上識(shí)別有效性更高;在時(shí)間的識(shí)別有效性方面,文獻(xiàn)[21]算法檢測(cè)到的停留時(shí)間等于與實(shí)際相符的停留時(shí)間且遠(yuǎn)小于標(biāo)記停留區(qū)域的停留時(shí)間,停留區(qū)域個(gè)數(shù)多于標(biāo)記的停留區(qū)域個(gè)數(shù),說(shuō)明文獻(xiàn)[21]算法難以檢測(cè)到停留區(qū)域的邊緣點(diǎn),且在噪聲影響下將一個(gè)大的時(shí)空停留區(qū)域切分成幾個(gè)小區(qū)域。

        表2 兩種算法的停留點(diǎn)識(shí)別結(jié)果Table 2 Recognition results of stop points of the two algorithms

        在時(shí)間效率方面,文獻(xiàn)[21]算法的時(shí)空密度計(jì)算次數(shù)為Nap×N(N為軌跡點(diǎn)的個(gè)數(shù)),本文算法的計(jì)算次數(shù)為網(wǎng)格軌跡時(shí)空聯(lián)結(jié)后所得簇?cái)?shù)S,文獻(xiàn)[21]算法作為DBSCAN 聚類算法的變型,其復(fù)雜度為O(N2)。在計(jì)算效率方面,本文算法的耗時(shí)遠(yuǎn)低于文獻(xiàn)[21]算法,計(jì)算效率更高,可直接應(yīng)用于大樣本的手機(jī)信令數(shù)據(jù)計(jì)算,而文獻(xiàn)[21]算法無(wú)法應(yīng)用于大樣本數(shù)據(jù)的計(jì)算。

        圖6 為標(biāo)記的停留區(qū)域與不同算法檢測(cè)到的停留區(qū)域(彩色效果參見(jiàn)《計(jì)算機(jī)工程》官網(wǎng)HTML版)。其中,標(biāo)記的停留區(qū)域stay4 被文獻(xiàn)[21]算法分割為stay7、stay8(被stay9 覆蓋)、stay9、stay10 和stay11 共5 個(gè)小區(qū)域,而本文算法檢測(cè)到的停留區(qū)域與標(biāo)記的停留區(qū)域stay4 地理位置一致,說(shuō)明本文算法能將時(shí)空緊密的軌跡點(diǎn)聯(lián)結(jié)為一個(gè)整體,并有效識(shí)別出停留區(qū)域,在較大程度上消除噪聲以及采樣不均造成的空間不確定性對(duì)停留點(diǎn)識(shí)別的影響,從而錨固住停留區(qū)域,不易使停留時(shí)空區(qū)域被分割。此外本文算法中時(shí)空移動(dòng)能力相較文獻(xiàn)[21]算法具有更好的區(qū)分性與穩(wěn)定性,可使網(wǎng)格簇的時(shí)空密度測(cè)定更準(zhǔn)確。

        圖6 標(biāo)記的停留區(qū)域與不同算法檢測(cè)的停留區(qū)域Fig.6 Marked residence area and residence area detected by different algorithms

        由上述分析可知,文獻(xiàn)[21]算法的可靠性除了選定σMA和σdis外,還與采樣間隔及Nap 參數(shù)選取相關(guān),而參數(shù)選取對(duì)本文算法影響較小,可根據(jù)時(shí)空密度分布自動(dòng)選取閾值,因此本文算法的穩(wěn)定性和可靠性較文獻(xiàn)[21]算法更優(yōu)。結(jié)合圖6 中數(shù)據(jù)質(zhì)量來(lái)看,由于本文實(shí)驗(yàn)采集的出行軌跡較密集,而現(xiàn)實(shí)中手機(jī)信令頻率遠(yuǎn)小于實(shí)驗(yàn)采集頻率,合并連續(xù)同位置的網(wǎng)格與現(xiàn)實(shí)中信令數(shù)據(jù)的觸發(fā)更接近,且本文基于網(wǎng)格簇空間密度劃分軌跡點(diǎn),較基于軌跡點(diǎn)密度劃分軌跡點(diǎn)在空間上的可行性更強(qiáng),因此本文算法更適用于現(xiàn)實(shí)中手機(jī)信令軌跡點(diǎn)識(shí)別。

        4 結(jié)束語(yǔ)

        手機(jī)信令因具有數(shù)據(jù)采樣率不均、定位精度低與空間不確定性,給網(wǎng)絡(luò)軌跡點(diǎn)分析、出行鏈提取等基礎(chǔ)性研究帶來(lái)困難,而現(xiàn)有消除空間不確定性的預(yù)處理算法缺乏從時(shí)空角度綜合度量軌跡點(diǎn)移動(dòng)與停留情況的指標(biāo)。本文提出一種時(shí)空密度軌跡點(diǎn)識(shí)別算法,根據(jù)出行定義和振蕩噪聲特征通過(guò)時(shí)空聯(lián)結(jié)識(shí)別潛在停留簇,以消除空間不確定性對(duì)后續(xù)聚類的影響,同時(shí)結(jié)合軌跡的曲折性、移動(dòng)時(shí)間和停留時(shí)間重新定義網(wǎng)格簇內(nèi)軌跡點(diǎn)的移動(dòng)能力,基于前后網(wǎng)格簇間與簇內(nèi)軌跡點(diǎn)間的時(shí)空關(guān)系和軌跡簇移動(dòng)能力構(gòu)建時(shí)空密度指標(biāo)進(jìn)行軌跡點(diǎn)停留區(qū)域分析。實(shí)驗(yàn)結(jié)果表明,與改進(jìn)DBSCAN 算法相比,該算法識(shí)別精度和時(shí)效性更高。由于軌跡點(diǎn)識(shí)別結(jié)果是具有停留屬性的軌跡點(diǎn)集群,其中包括真實(shí)活動(dòng)區(qū)域、候車區(qū)域以及交通擁堵區(qū)域等,因此后續(xù)將對(duì)停留區(qū)域的真實(shí)活動(dòng)屬性進(jìn)行研究,以挖掘個(gè)體活動(dòng)規(guī)律,進(jìn)一步提高識(shí)別精度和效率。

        猜你喜歡
        信令時(shí)空基站
        跨越時(shí)空的相遇
        鏡中的時(shí)空穿梭
        SLS字段在七號(hào)信令中的運(yùn)用
        移動(dòng)信令在交通大數(shù)據(jù)分析中的應(yīng)用探索
        玩一次時(shí)空大“穿越”
        基于信令分析的TD-LTE無(wú)線網(wǎng)絡(luò)應(yīng)用研究
        可惡的“偽基站”
        基于GSM基站ID的高速公路路徑識(shí)別系統(tǒng)
        時(shí)空之門
        LTE網(wǎng)絡(luò)信令采集數(shù)據(jù)的分析及探討
        白白视频在线免费观看| 国产无人区码一码二码三mba| 国产精品无套内射迪丽热巴| 亚洲韩国在线| 色综合久久人妻精品日韩| 99视频在线精品免费观看6| 真人新婚之夜破苞第一次视频| 亚洲一区综合精品狠狠爱| 一本久久综合亚洲鲁鲁五月夫| 东京热日本av在线观看| 97久久超碰国产精品旧版| 在线观看国产高清免费不卡黄| av东京热一区二区三区| 国产麻豆精品传媒av在线| 玩50岁四川熟女大白屁股直播| 欧美亚洲国产另类在线观看| 青青草最新在线视频观看| 国产精品女直播一区二区| 97人人模人人爽人人喊电影 | 少妇精品无码一区二区三区| 国产人妖在线免费观看| 国产三级久久精品三级91| 精品9e精品视频在线观看| 久久精品免费无码区| 亚洲精品综合久久中文字幕| 亚洲av永久无码精品一福利| 久久久久国产精品免费免费搜索| AV无码专区亚洲AVL在线观看| 国产国语按摩对白av在线观看| 夜夜揉揉日日人人青青| 欧美巨大精品欧美一区二区| 伊人久久大香线蕉综合av| 男人国产av天堂www麻豆| 国产精品免费久久久久影院仙踪林 | www.av在线.com| 一级黄色一区二区三区| 国产人妻丰满熟妇嗷嗷叫| 精品一精品国产一级毛片| 老熟妇嗷嗷叫91九色| 后入到高潮免费观看| 色婷婷七月|