張 巖,李英冰,鄭 翔,劉 虎
(1.武漢大學(xué) 測繪遙感信息工程國家重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430072;2.武漢大學(xué) 測繪學(xué)院,湖北 武漢 430072;3.武漢大學(xué) 信息管理學(xué)院,湖北 武漢 430072)
國內(nèi)外基于車輛OD軌跡的研究集中在城市熱點(diǎn)區(qū)域發(fā)現(xiàn)[1]、居民出行行為分析[2]、碳排放與環(huán)境污染[3]以及推薦最佳行駛路線提高出行效率[4]等領(lǐng)域。根據(jù)出租車軌跡的行駛特征[5],可識別不同種類的城市用地[6],也可分析不同時(shí)刻人群空間聚集特征和城市興趣點(diǎn)(POI,泛指一切可抽象為點(diǎn)的地理對象,尤其是一些與人們生活密切相關(guān)的地理實(shí)體)空間分布特征[7],為城市規(guī)劃提供參考[8-9]。利用OD軌跡可挖掘城市居民的出行習(xí)慣以及劃分不同種類居民的出行模式[10];針對不同乘客出行軌跡的差異,識別出異常的扒竊團(tuán)伙[11];通過分析通勤結(jié)構(gòu)來估計(jì)乘客的社會屬性與經(jīng)濟(jì)屬性[12]。
出租車可以覆蓋城市大部分區(qū)域,是公交、地鐵等居民出行方式的有力補(bǔ)充,共同構(gòu)成復(fù)雜的交通網(wǎng)絡(luò)。本文將復(fù)雜網(wǎng)絡(luò)引入出租車軌跡研究中,從全局角度研究了出行數(shù)據(jù)的時(shí)空分布以及聚類中心的空間關(guān)聯(lián);進(jìn)行了細(xì)顆粒度的空間網(wǎng)格劃分,分析了成都市市區(qū)熱點(diǎn)區(qū)域之間的空間關(guān)聯(lián)性;通過核密度估計(jì)方法確定不同區(qū)域的交通便捷性,利用密度聚類方法理解城市結(jié)構(gòu),根據(jù)4個(gè)時(shí)刻的城市凈流量比分布挖掘城市功能分區(qū),基于復(fù)雜網(wǎng)絡(luò)研究居民出行意愿分布,可為公交站點(diǎn)布設(shè)、不同時(shí)間范圍出租車的最佳活動(dòng)區(qū)域確定、城市地塊功能分類研究提供支持。
本文選取成都市市區(qū)作為研究區(qū)。成都市是四川省省會,也是我國西南地區(qū)唯一副省級城市,下轄20個(gè)縣(區(qū)),共259個(gè)鄉(xiāng)鎮(zhèn)、116個(gè)街道。出租車訂單數(shù)據(jù)大多集中在金牛區(qū)、青羊區(qū)、成華區(qū)、武侯區(qū)、錦江區(qū)等5個(gè)核心繁華市區(qū),在WGS84坐標(biāo)系下介于30.529 114~30.809 326 N、103.894 287~104.234 131 E之間,即本文最主要的研究區(qū)域。
根據(jù)經(jīng)緯度將城市劃分為棋盤狀的網(wǎng)格結(jié)構(gòu),如圖1所示,并依據(jù)編碼標(biāo)定在地圖上。根據(jù)不同時(shí)刻或不同圖層構(gòu)建時(shí)空立方體模型,不同網(wǎng)格具有不同屬性,從時(shí)間/圖層維進(jìn)行時(shí)空快照即可獲取某屬性下的圖層切片。其優(yōu)點(diǎn)在于數(shù)據(jù)的共享、存儲與查詢,方便下一步的社區(qū)動(dòng)態(tài)劃分與空間數(shù)據(jù)挖掘[13]。
圖1 時(shí)空立方體模型
本文采用的數(shù)據(jù)主要包括2016年11月1日-7日的出租車軌跡數(shù)據(jù),包含訂單開始的GPS坐標(biāo)與時(shí)間、采樣間隔30 s的軌跡路徑以及訂單結(jié)束時(shí)的坐標(biāo)與時(shí)間。本文主要研究11月1日的出租車軌跡數(shù)據(jù),GPS定位精度約為10 m,共約20萬條訂單數(shù)據(jù),如圖2所示,可以看出,基本呈內(nèi)部密集、外部稀疏的狀態(tài),且打車位置沿主干道向外呈放射狀,與成都市城市結(jié)構(gòu)一致。
圖2 點(diǎn)位分布
1.3.1 時(shí)間特征分析
研究時(shí)段內(nèi)居民出行頻率分布如圖3所示。繪制一周內(nèi)所有時(shí)間的訂單箱線圖發(fā)現(xiàn),訂單最多的時(shí)刻出現(xiàn)在11月5日17時(shí)(周六),1 h內(nèi)產(chǎn)生了14 901個(gè)訂單;周五、周六、周一的訂單量較多,9時(shí)、14時(shí)、17時(shí)以及20時(shí)左右是乘客出行最活躍的時(shí)間。
圖3 出行頻率圖
1.3.2 空間特征分析
訂單時(shí)空分布如圖4所示,可以看出,城市中具有大量人流的商圈、景點(diǎn)、汽車站、火車站是出租車訂單較密集的區(qū)域,且受公共交通便捷程度的影響。將研究區(qū)劃分為50×50的網(wǎng)格,網(wǎng)格實(shí)際邊長為500~600 m,統(tǒng)計(jì)網(wǎng)格內(nèi)訂單數(shù)量,并進(jìn)行空間相交發(fā)現(xiàn):出行區(qū)域主要集中在青羊區(qū)與錦江區(qū)之間,呈現(xiàn)一種不規(guī)則的同心圓模式[14],1 d內(nèi)平均網(wǎng)格訂單數(shù)量超過400,該區(qū)域包括寬窄巷子、春熙路、天府廣場等核心商圈;其余訂單數(shù)超過900的網(wǎng)格基本都在成都東客運(yùn)站、武侯祠、昭覺寺汽車站等重要興趣點(diǎn)附近。
圖4 訂單時(shí)空分布與公交核密度估計(jì)
從平均每單持續(xù)時(shí)間的角度來看,由于軌道交通、公共交通較方便的原因,成都市中心的訂單大多載客0.5 h以內(nèi),市區(qū)西南部訂單持續(xù)時(shí)長長于東北部;外地旅客較多的客運(yùn)站(成都東、成都站)、軌道交通無法直達(dá)的旅游區(qū)(熊貓基地、歡樂谷)平均訂單時(shí)長超過60 min。對成都市區(qū)公交車站點(diǎn)進(jìn)行核密度估計(jì)發(fā)現(xiàn),訂單時(shí)長越長的區(qū)域公交站點(diǎn)密度越低。
由圖2可知,訂單數(shù)量基本隨著與市中心距離的增加而減少。根據(jù)劃分好的網(wǎng)格,本文從訂單信息中挖掘出時(shí)空熱點(diǎn),以網(wǎng)格作為復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)節(jié)點(diǎn),以不同網(wǎng)格之間的OD關(guān)聯(lián)建立復(fù)雜網(wǎng)絡(luò)的有向邊,以節(jié)點(diǎn)之間的連接強(qiáng)度代表有向邊的權(quán)重,分析城市不同區(qū)域之間的出行聯(lián)系,進(jìn)行城市社區(qū)結(jié)構(gòu)發(fā)現(xiàn),發(fā)掘內(nèi)部聯(lián)系緊密的城市區(qū)域。
復(fù)雜網(wǎng)絡(luò)始于隨機(jī)圖理論,是大量真實(shí)復(fù)雜系統(tǒng)的拓?fù)涑橄?是介于規(guī)則網(wǎng)絡(luò)與隨機(jī)網(wǎng)絡(luò)之間的一種網(wǎng)絡(luò)結(jié)構(gòu)。復(fù)雜網(wǎng)絡(luò)具有小世界、無標(biāo)度特性,小世界特性是指具有大的簇系數(shù)和小的平均距離網(wǎng)絡(luò);無標(biāo)度特性是指在網(wǎng)絡(luò)中的大部分節(jié)點(diǎn)(小度節(jié)點(diǎn))只與很少節(jié)點(diǎn)連接,而有極少的節(jié)點(diǎn)(大度節(jié)點(diǎn))與非常多的節(jié)點(diǎn)連接,即符合如圖5所示的冪分布。
圖5 復(fù)雜網(wǎng)絡(luò)無標(biāo)度特性
在實(shí)際生活中,微博大V的數(shù)量很少,卻可覆蓋上億用戶,絕大部分用戶只擁有數(shù)十或數(shù)百個(gè)用戶聯(lián)系,這種社會現(xiàn)象也屬于復(fù)雜網(wǎng)絡(luò)的無標(biāo)度特性。復(fù)雜網(wǎng)絡(luò)可以用一張圖來構(gòu)建模型G=(V,E),其中V為復(fù)雜網(wǎng)絡(luò)所有節(jié)點(diǎn)的集合,E為所有邊的集合[15]。利用成都市出租車OD軌跡數(shù)據(jù)可建立類似的關(guān)聯(lián)矩陣M,m為確定的節(jié)點(diǎn)數(shù)目,Nij為數(shù)據(jù)點(diǎn)i至數(shù)據(jù)點(diǎn)j的訂單數(shù)目,越大代表地區(qū)之間的關(guān)聯(lián)性越強(qiáng)。
一個(gè)典型的復(fù)雜網(wǎng)絡(luò)是由若干個(gè)節(jié)點(diǎn)及其之間不同權(quán)重的連接邊構(gòu)成的,而復(fù)雜網(wǎng)絡(luò)內(nèi)部又由若干個(gè)社區(qū)組成,同一社區(qū)內(nèi)節(jié)點(diǎn)之間的互動(dòng)比在不同社區(qū)之間更加頻繁。社區(qū)結(jié)構(gòu)是復(fù)雜網(wǎng)絡(luò)的一個(gè)重要拓?fù)浣Y(jié)構(gòu)特征[16]。OD點(diǎn)聚集區(qū)域周邊具有大量居民活動(dòng)行為,是整個(gè)市區(qū)的熱點(diǎn)區(qū)域,若有大量OD點(diǎn)相同的軌跡存在,則證明這兩個(gè)區(qū)域之間存在某種空間關(guān)聯(lián),本文從這點(diǎn)著手構(gòu)建具有有向邊的復(fù)雜網(wǎng)絡(luò)。
社區(qū)結(jié)構(gòu)發(fā)現(xiàn)是指根據(jù)復(fù)雜網(wǎng)絡(luò)節(jié)點(diǎn)之間的有向連接,將節(jié)點(diǎn)一個(gè)個(gè)劃分到社區(qū)中的過程,社區(qū)內(nèi)部節(jié)點(diǎn)存在某種相同特質(zhì)。常用的社區(qū)結(jié)構(gòu)發(fā)現(xiàn)算法包括圖分割理論、Louvain算法、GN算法、Newman快速算法等,用于社交軟件用戶關(guān)系網(wǎng)絡(luò)構(gòu)建和聯(lián)系人自動(dòng)推薦[11]。
本文采用Louvain算法進(jìn)行社區(qū)結(jié)構(gòu)發(fā)現(xiàn)。其優(yōu)點(diǎn)在于算法效率很高,可將所有邊緣節(jié)點(diǎn)統(tǒng)一納入考慮,且獲得的社區(qū)結(jié)構(gòu)具有層次性[17]。該算法的劃分評判是基于模塊度的,模塊度越大代表社區(qū)結(jié)構(gòu)越明顯。模塊度數(shù)學(xué)上的定義為:
式中,Aij為節(jié)點(diǎn)i與j之間邊的權(quán)重;ki為節(jié)點(diǎn)的度(節(jié)點(diǎn)的弧尾條數(shù)與弧頭條數(shù)之和);m為復(fù)雜網(wǎng)絡(luò)中節(jié)點(diǎn)的總數(shù);Ci為節(jié)點(diǎn)i的社區(qū),當(dāng)Ci=Cj時(shí),函數(shù)δ為1,否則為0;在隨機(jī)情況下,節(jié)點(diǎn)i與節(jié)點(diǎn)j之間的邊數(shù)為
Louvain算法的具體流程為:①將每個(gè)節(jié)點(diǎn)看作一個(gè)獨(dú)立的社區(qū),初始社區(qū)數(shù)目與網(wǎng)格(節(jié)點(diǎn))數(shù)目相同;②遍歷任意一個(gè)節(jié)點(diǎn)i,考慮其鄰居j,通過從節(jié)點(diǎn)i所屬社區(qū)移除節(jié)點(diǎn)i,再將其加入屬于節(jié)點(diǎn)j的社區(qū),計(jì)算模塊度的變化并進(jìn)行比較,將節(jié)點(diǎn)i放入模塊度增加最大的社區(qū),若無法找到模塊度收益為正的節(jié)點(diǎn)j,則保持節(jié)點(diǎn)i原有社區(qū);③重復(fù)步驟②,直至達(dá)到模塊度局部最大值,即沒有任何節(jié)點(diǎn)可提高網(wǎng)絡(luò)模塊度,社區(qū)結(jié)構(gòu)不再發(fā)生改變;④對步驟③得到的社區(qū)結(jié)構(gòu)進(jìn)行壓縮,將原有社區(qū)壓縮成新節(jié)點(diǎn),社區(qū)內(nèi)部節(jié)點(diǎn)權(quán)重轉(zhuǎn)化為新節(jié)點(diǎn)環(huán)權(quán)重,原社區(qū)之間邊權(quán)重轉(zhuǎn)化為節(jié)點(diǎn)之間邊權(quán)重;⑤重復(fù)步驟①直至社區(qū)結(jié)構(gòu)不再發(fā)生改變。
凈流量比(NFR)是指在特定時(shí)段內(nèi)居民由其他熱點(diǎn)區(qū)域凈流入某熱點(diǎn)區(qū)域的占比,范圍為[-1,1],能在一定程度上反映某熱點(diǎn)區(qū)域的相對熱度。當(dāng)NFR>0時(shí),表明節(jié)點(diǎn)的熱度增強(qiáng);反之,則表明節(jié)點(diǎn)的熱度減弱;當(dāng)NFR=-1時(shí),表明熱點(diǎn)區(qū)域在該時(shí)段內(nèi)只有流出沒有流入;當(dāng)NFR=1時(shí),則表明熱點(diǎn)區(qū)域在該時(shí)段內(nèi)只有流入沒有流出。NFR的計(jì)算公式為:
式中,Flowin為流入強(qiáng)度;Flowout為流出強(qiáng)度。
本文選取7-9點(diǎn)、12-14點(diǎn)、18-20點(diǎn)、21-23點(diǎn)4個(gè)時(shí)間段進(jìn)行時(shí)空快照,單位網(wǎng)格訂單數(shù)量小于10則視為無效網(wǎng)格過濾掉,分類間隔采用自定義間隔,如圖6所示,可以看出,早高峰市區(qū)中心(五區(qū)交界與錦江區(qū)北部,A區(qū)域)急劇匯集,茶店子客運(yùn)站(B區(qū)域)、雙流機(jī)場(C區(qū)域)、集貿(mào)市場(D區(qū)域)、成都東站(E區(qū)域)、石羊客運(yùn)站(F區(qū)域)等對人群的吸引力上升;夜間市中心基本呈凈流出狀態(tài),城市周邊吸引力增強(qiáng),雙流機(jī)場與成都東客站開始凈流出,金牛區(qū)與二仙橋等網(wǎng)格呈凈流入狀態(tài),城市北部與東部等區(qū)域吸引力增強(qiáng),推測該區(qū)域內(nèi)多居民居住區(qū)。
圖6 4個(gè)時(shí)間段空間NFR分布
本文對成都市網(wǎng)格劃分結(jié)果進(jìn)行社區(qū)檢測,節(jié)點(diǎn)采用地理布局,主要檢測指標(biāo)[18]包括:①節(jié)點(diǎn)的度,在有向圖中以某節(jié)點(diǎn)的弧尾條數(shù)為節(jié)點(diǎn)的出度,某節(jié)點(diǎn)的弧頭條數(shù)為節(jié)點(diǎn)的入度,節(jié)點(diǎn)的度=出度+入度,本文數(shù)據(jù)中各點(diǎn)度之和為有向弧的兩倍(圖7),以節(jié)點(diǎn)的大小代表度的大?。虎趫D密度,在研究的有向網(wǎng)絡(luò)中,圖密度=總弧數(shù)/(節(jié)點(diǎn)數(shù)×節(jié)點(diǎn)數(shù)-節(jié)點(diǎn)數(shù)),結(jié)果越大表示網(wǎng)絡(luò)連接越緊密;③模塊度,值越大代表社區(qū)結(jié)構(gòu)越明顯;④網(wǎng)絡(luò)直徑,復(fù)雜網(wǎng)絡(luò)中任意兩點(diǎn)最短距離的最大值,越小代表點(diǎn)之間的可達(dá)性越好;⑤平均度,每個(gè)節(jié)點(diǎn)連接邊的平均數(shù);⑥加權(quán)平均度,每個(gè)節(jié)點(diǎn)連接邊的加權(quán)平均。
在400個(gè)網(wǎng)格顆粒度的空間尺度下,共有18 315條網(wǎng)格之間的連接邊,如圖7所示,將網(wǎng)格劃分為模塊度為0.124的13個(gè)社區(qū),剔除與其他社區(qū)沒有聯(lián)系的社區(qū),還有6個(gè)較大的社區(qū)。最大的社區(qū)占有37.75%的網(wǎng)格,較大社區(qū)依次占據(jù)22.25%、16.75%、11.25%、5.75%、4.5%的空間網(wǎng)格,社區(qū)劃分基本沿著市區(qū)主干道進(jìn)行。復(fù)雜網(wǎng)絡(luò)的網(wǎng)絡(luò)直徑為4,模塊度為0.124,圖密度為0.115,平均路徑長度為1.944,平均度為45.788,加權(quán)平均度為513.745。從其中任何一個(gè)網(wǎng)格到另外一個(gè)網(wǎng)格的距離不超過兩個(gè)網(wǎng)格,體現(xiàn)了復(fù)雜網(wǎng)絡(luò)的小世界特性[19]。
圖7 細(xì)顆粒度網(wǎng)絡(luò)小世界特性與社區(qū)劃分結(jié)構(gòu)
檢驗(yàn)網(wǎng)格之間的流動(dòng)隨時(shí)間的變化,進(jìn)而分析出租車的流量去向,由圖8的?;鶊D可知,熱點(diǎn)網(wǎng)格占有絕對流量比例,ID 為190 靠近市中心的網(wǎng)格,獲取了最多的的流量,這也符合復(fù)雜網(wǎng)絡(luò)的無標(biāo)度特性。
圖8 細(xì)顆粒度網(wǎng)絡(luò)無標(biāo)度特性與流量分析
本文利用出租車軌跡大數(shù)據(jù)挖掘城市熱點(diǎn)區(qū)域的時(shí)空關(guān)聯(lián)與結(jié)構(gòu),將成都市5個(gè)核心行政區(qū)劃分為50×50的網(wǎng)格,分別探討了訂單時(shí)間分布特征、空間分布特征、平均時(shí)長分布特征;對20萬條出租車訂單數(shù)據(jù)進(jìn)行空間熱點(diǎn)發(fā)現(xiàn),尋找城市中較活躍且具有代表性的重要區(qū)域;并根據(jù)劃分的空間網(wǎng)格進(jìn)行社區(qū)結(jié)構(gòu)挖掘。相較于利用行政區(qū)劃來代表網(wǎng)絡(luò)節(jié)點(diǎn),根據(jù)細(xì)顆粒的空間網(wǎng)格可避免行政區(qū)劃撕裂軌跡之間的聯(lián)系,也有利于發(fā)掘市區(qū)更具代表性的軌跡節(jié)點(diǎn)。結(jié)果表明,居民出租車出行的高峰期為13時(shí)、14時(shí)和17時(shí),中午和下班時(shí)間較為活躍;訂單密度基本上呈同心圓結(jié)構(gòu),隨著與市中心距離的增大而減小,打車位置沿主干道向郊區(qū)擴(kuò)散;市區(qū)訂單基本集中在0.5 h以內(nèi)的短途出行,訂單時(shí)長呈西南長東北短的分布狀況,且與公交車站點(diǎn)密度成反比;熱點(diǎn)區(qū)域的聚類結(jié)果表明大部分?jǐn)?shù)據(jù)都集中在三環(huán)線以內(nèi),二環(huán)線內(nèi)密度遠(yuǎn)高于周邊區(qū)域;利用細(xì)顆粒度網(wǎng)格法將400個(gè)網(wǎng)格劃分為6個(gè)社區(qū),驗(yàn)證了復(fù)雜網(wǎng)絡(luò)的特性;利用NFR發(fā)現(xiàn)了市區(qū)人流的潮汐效應(yīng)以及夜間居民區(qū)對人流的吸引。
今后將結(jié)合點(diǎn)模式分析手段,利用密度聚類算法構(gòu)建網(wǎng)絡(luò)節(jié)點(diǎn),分析一周內(nèi)不同時(shí)刻的影響,研究網(wǎng)絡(luò)脆弱性[20]以及市區(qū)更細(xì)顆粒度的熱點(diǎn)發(fā)現(xiàn)工作。