杜 洋,柴 彥 威,楊 家 文,梁 軍 輝,藍(lán) 建 航
(1.北京大學(xué)城市規(guī)劃與設(shè)計(jì)學(xué)院,北京 100871;2.北京大學(xué)城市與環(huán)境學(xué)院,北京 100871;3.北京師范大學(xué)地理學(xué)與遙感科學(xué)學(xué)院,北京 100875)
隨著交通規(guī)劃由注重設(shè)施建設(shè)向注重居民出行需求管理轉(zhuǎn)變[1],居民活動(dòng)時(shí)空間特征受到學(xué)者的廣泛關(guān)注?,F(xiàn)階段,居民自主選擇能力與移動(dòng)性增加,個(gè)體能夠到達(dá)空間范圍在擴(kuò)大[2,3],個(gè)體行為的日間差異[4]和彈性[5]越來(lái)越強(qiáng);但是,個(gè)體行為所受到時(shí)空固定性制約從未減弱[6,7],Long等利用公交卡數(shù)據(jù)對(duì)于居民職住空間和通勤路徑的提取和分析支持了這一觀點(diǎn)[8];劉瑜等通過(guò)研究提出城市尺度的個(gè)體行為具有隨機(jī)部分(unforeseeable movements)和慣常部分(predetermined movements),并受到地理空間的影響[9]。一些學(xué)者提出,個(gè)體行為的規(guī)律性可由可預(yù)測(cè)性的概念進(jìn)行定量測(cè)度,即居民未來(lái)行為可以被預(yù)測(cè)的可能性??深A(yù)測(cè)性越強(qiáng)說(shuō)明居民行為越具有規(guī)律性,反之,則說(shuō)明個(gè)體行為越具有物理學(xué)意義上的布朗運(yùn)動(dòng)特征[10]。這一概念的提出對(duì)于行為規(guī)律性的研究和行為研究在規(guī)劃中的應(yīng)用起到了重要作用。
隨著定位技術(shù)、信息與通信技術(shù) (ICT)的發(fā)展與廣泛應(yīng)用,基于GPS、GSM等定位技術(shù)獲取的個(gè)體行為時(shí)空數(shù)據(jù)為基于個(gè)體的居民活動(dòng)可預(yù)測(cè)性分析提供了新的契機(jī)。Song等基于美國(guó)手機(jī)信號(hào)塔數(shù)據(jù)(5 000樣本,30 d)進(jìn)行個(gè)體活動(dòng)可預(yù)測(cè)性分析,發(fā)現(xiàn)個(gè)體活動(dòng)的可預(yù)測(cè)性普遍在93%以上[11,12];Lu等基于科特迪瓦手機(jī)信號(hào)塔數(shù)據(jù)(50 000樣本,120 d)研究得出理論上最大的個(gè)體活動(dòng)的可預(yù)測(cè)性達(dá)到88%[13,14]。國(guó)內(nèi)現(xiàn)階段開(kāi)展了一些匯總層面上針對(duì)交通流量可預(yù)測(cè)性的研究[15,16],但是基于個(gè)體的居民活動(dòng)可預(yù)測(cè)性研究尚缺乏相對(duì)完整的實(shí)證研究[17]。總結(jié)來(lái)看,國(guó)內(nèi)外現(xiàn)階段的研究首先普遍存在數(shù)據(jù)精度不足的問(wèn)題。不論是 Wi-fi數(shù)據(jù)還是手機(jī)信號(hào)塔數(shù)據(jù),由于服務(wù)范圍較大的原因,空間精度相對(duì)較低;同時(shí)由于是被動(dòng)收受數(shù)據(jù),時(shí)間精度也不能得到保證。從研究視角看,國(guó)內(nèi)現(xiàn)在尚處于匯總層面的可預(yù)測(cè)性研究,基于個(gè)體活動(dòng)的非匯總層面的研究仍然空缺。
本研究關(guān)注個(gè)體活動(dòng)的時(shí)空間可預(yù)測(cè)性,基于GPS手段收集居民一周真實(shí)時(shí)空路徑數(shù)據(jù),利用信息熵算法分析北京城市居民日?;顒?dòng)的可預(yù)測(cè)性的大小。在此基礎(chǔ)上,結(jié)合居民的活動(dòng)范圍,探究活動(dòng)半徑是否會(huì)對(duì)可預(yù)測(cè)性產(chǎn)生影響;同時(shí)結(jié)合居民的活動(dòng)規(guī)律,分析不同時(shí)間點(diǎn)居民活動(dòng)可預(yù)測(cè)性的差異。
本研究以北京為案例城市,于2012年9-12月對(duì)北京市上地和清河兩個(gè)街道進(jìn)行抽樣調(diào)查,采用位置感知設(shè)備、互動(dòng)式調(diào)查網(wǎng)站及電話訪談相結(jié)合的辦法,通過(guò)居委會(huì)對(duì)兩個(gè)街道選取樣本,每個(gè)樣本調(diào)查時(shí)間為一周,調(diào)查內(nèi)容包括居民、居民社會(huì)經(jīng)濟(jì)屬性、一周活動(dòng)日志及GPS軌跡(樣本活動(dòng)的時(shí)空間坐標(biāo)點(diǎn)是以3 min為間隔均勻獲?。?,最終獲得有效樣本709個(gè)。調(diào)查樣本中女性略多于男性,平均年齡34.6歲,85%以上居民具有高中以上學(xué)歷,就業(yè)比例為89.5%。從空間屬性看(圖1、表1),由于調(diào)查區(qū)范圍的限制,樣本居住地和市中心距離分布偏離標(biāo)準(zhǔn)正態(tài)分布。就業(yè)地和市中心距離分布符合標(biāo)準(zhǔn)正態(tài)分布,職住距離和活動(dòng)半徑分布均符合泊松分布。
隨機(jī)選取單個(gè)樣本,對(duì)其一周出行軌跡進(jìn)行可視化顯示(圖2),樣本周一、周二、周五、周六沿同一條路徑前往相同目的地,而周三、周四、周日又沿另一條相同路徑前往另一個(gè)相同的目的地。為了更好地理解樣本活動(dòng)規(guī)律性的特征,將活動(dòng)區(qū)域劃分為1 km*1 km的網(wǎng)格,運(yùn)用網(wǎng)格計(jì)數(shù)法抽象樣本的活動(dòng)過(guò)程(圖3)。結(jié)果顯示,樣本坐標(biāo)點(diǎn)集中程度非常高,樣本趨向于在幾個(gè)特定的網(wǎng)格范圍內(nèi)花費(fèi)其大部分的時(shí)間。直觀看出,樣本活動(dòng)具有顯著的規(guī)律性。
信息熵是為了解決對(duì)信息的量化度量問(wèn)題,表征的是樣本在條件約束下,新增加一個(gè)坐標(biāo)點(diǎn)所能提供給的信息量。如果樣本只在一個(gè)網(wǎng)格范圍內(nèi)活動(dòng),那么這個(gè)樣本的活動(dòng)位置是確定的,新增加一個(gè)坐標(biāo)點(diǎn)提供的信息量是0 bit,熵值為0;相反,如果樣本在多網(wǎng)格范圍內(nèi)活動(dòng),如26個(gè)網(wǎng)格,那么新增加一個(gè)坐標(biāo)點(diǎn),提供的信息量就是6 bits,熵值為6。熵值越大表示活動(dòng)位置越混亂,不確定性也越大,可預(yù)測(cè)性也越低。本文定義3個(gè)熵值:
(1)隨機(jī)熵SrandI。SrandI表征不考慮樣本i在每個(gè)網(wǎng)格范圍內(nèi)出現(xiàn)的時(shí)刻和出現(xiàn)的頻率(即樣本i在每個(gè)網(wǎng)格中出現(xiàn)的概率相同)的條件下,樣本i活動(dòng)地點(diǎn)可預(yù)測(cè)性的大小。計(jì)算公式如下:
式中:Ni表示出現(xiàn)樣本i的軌跡點(diǎn)的網(wǎng)格個(gè)數(shù)。
式中:Ni表示出現(xiàn)樣本i的軌跡點(diǎn)的網(wǎng)格的個(gè)數(shù),Pk表示軌跡點(diǎn)落入網(wǎng)格k中的概率。
(3)真實(shí)熵Sreali。Sreali表征同時(shí)考慮樣本i在每個(gè)網(wǎng)格中出現(xiàn)的時(shí)刻和出現(xiàn)的頻率(即樣本i坐標(biāo)點(diǎn)真實(shí)的時(shí)空間序列,包括空間規(guī)律性和時(shí)間規(guī)律性)的條件下,樣本i活動(dòng)地點(diǎn)可預(yù)測(cè)性的大小。為了實(shí)現(xiàn)這樣的考量,本文將樣本每天的軌跡以1 h為單位分段,假設(shè)Tj={X1,X2,…,Xm},代表樣本在j時(shí)段內(nèi)的m個(gè)活動(dòng)位置坐標(biāo)點(diǎn),則Sreali的計(jì)算公式如下:
式中:P(T′)表示樣本i在T′時(shí)段內(nèi)軌跡點(diǎn)落入網(wǎng)格的概率分布。
信息熵是度量可預(yù)測(cè)性大小的一種方式,但是并不夠直觀。本文引入費(fèi)諾不等式,對(duì)熵值進(jìn)行處理。費(fèi)諾不等式中,不確定性(即熵值Si)由兩部分組成:一部分指接收到坐標(biāo)集后,是否產(chǎn)生錯(cuò)誤的不確定性H(PFano),一部分指錯(cuò)誤發(fā)生后,到底是哪個(gè)坐標(biāo)造成錯(cuò)誤的最大不確定性log2(Li-1)*(1-PFano),而其概率值P則表征不出現(xiàn)錯(cuò)誤的最小可能性。假設(shè),一個(gè)樣本i有Li個(gè)可供選擇的活動(dòng)地點(diǎn),對(duì)應(yīng)熵值為Si,費(fèi)諾不等式能夠幫助計(jì)算得出樣本可預(yù)測(cè)性的極限。其計(jì)算公式如下:
將代表樣本熵值引入費(fèi)諾不等式所得計(jì)算結(jié)果可知:當(dāng)不考慮樣本的時(shí)間規(guī)律性和空間規(guī)律性,而只考慮樣本活動(dòng)的空間范圍(22 km2),那么樣本的可預(yù)測(cè)性只有5.3%;當(dāng)考慮了樣本活動(dòng)的空間規(guī)律性(每個(gè)網(wǎng)格中活動(dòng)的頻率),則樣本的可預(yù)測(cè)性提升至78.64%;當(dāng)既考慮了樣本的空間規(guī)律性,又考慮了樣本的時(shí)間規(guī)律性(活動(dòng)點(diǎn)落入某個(gè)網(wǎng)格所處的時(shí)段),則樣本的可預(yù)測(cè)性高達(dá)94.68%。可以看出,時(shí)間規(guī)律性和空間規(guī)律性是個(gè)體活動(dòng)模式的重要組成部分,二者引起個(gè)體活動(dòng)可預(yù)測(cè)性的大幅提升。
基于以上對(duì)于3個(gè)熵值的定義,計(jì)算每個(gè)樣本在3種條件下的熵值,匯總得到全體樣本熵值概率密度分布圖(圖4),Srand分布較為分散,主要集中在3~5,比例為59.5%,峰值為4;Sunci分布比較分散,主要集中在1~3,比例為74.3%,峰值為2;Sreal的分布非常集中,分布在0~1的比例為91%,峰值為0.5。結(jié)果顯示,北京市居民一周的活動(dòng)空間大小為16 km2左右,居民一小時(shí)內(nèi)平均活動(dòng)空間大小為1.41 km2。3個(gè)熵值的分布集中度遞進(jìn)增強(qiáng),熵值逐步縮小,說(shuō)明隨著條件限制的增強(qiáng),居民可預(yù)測(cè)性差異逐步縮小,同時(shí)可預(yù)測(cè)性大幅提升。
計(jì)算每個(gè)樣本在三種條件下對(duì)應(yīng)的可預(yù)測(cè)性值,匯總得到全體樣本可預(yù)測(cè)性概率密度分布圖(圖5),Pmax分布非常集中,普遍大于0.8,88.2%的樣本取值大于0.9,11.5%的樣本取值處于0.8~0.9之間;Punc的分布最為分散,樣本取值相對(duì)均勻地分布在0.3~0.9之間;Prand則集中分布在取值較低的區(qū)間,93%的樣本取值分布在0~0.3之間。上述結(jié)果反映出,居民的日?;顒?dòng)存在顯著的空間規(guī)律性和時(shí)間規(guī)律性,如果忽視規(guī)律性的存在而僅僅考慮居民的活動(dòng)范圍,則居民的活動(dòng)空間是均質(zhì)的,無(wú)法確定居民更有可能在哪個(gè)網(wǎng)格范圍內(nèi)活動(dòng),可預(yù)測(cè)性非常低;當(dāng)考慮了居民活動(dòng)的空間規(guī)律性,也因此掌握了居民的空間偏好,可預(yù)測(cè)性大幅提升;當(dāng)進(jìn)一步考慮居民活動(dòng)的時(shí)間規(guī)律性,可預(yù)測(cè)性就不再是基于居民整日的活動(dòng)空間進(jìn)行探討,而是基于某一時(shí)段內(nèi)(1 h)居民的可達(dá)范圍進(jìn)行探討,居民活動(dòng)可預(yù)測(cè)性非常高。
為了研究可預(yù)測(cè)性與活動(dòng)半徑之間的關(guān)系,這里用回轉(zhuǎn)半徑概念定義個(gè)體的活動(dòng)半徑?;剞D(zhuǎn)半徑定義活動(dòng)半徑的優(yōu)勢(shì)在于其具有較強(qiáng)的穩(wěn)定性和有界性[18]。公式如下:
式中:rcm表示該個(gè)體在統(tǒng)計(jì)時(shí)段內(nèi)所有軌跡點(diǎn)質(zhì)心的所在位置;ri為各個(gè)軌跡點(diǎn);nc(t)為在t時(shí)刻的軌跡點(diǎn)數(shù)量,上標(biāo)a表示對(duì)個(gè)體a進(jìn)行統(tǒng)計(jì)。
分析結(jié)果表明,樣本的活動(dòng)半徑服從泊松分布,95%的樣本活動(dòng)半徑分布在0~10 km以內(nèi)。對(duì)活動(dòng)半徑和可預(yù)測(cè)性二者進(jìn)行顯著性檢驗(yàn),結(jié)果顯示兩者之間相關(guān)系數(shù)為0.95,在0.01水平上顯著相關(guān)。圖6是活動(dòng)半徑與可預(yù)測(cè)性兩者之間的散點(diǎn)圖,可以看出,活動(dòng)半徑小于10 km的樣本,可預(yù)測(cè)性與活動(dòng)半徑之間相關(guān)性較強(qiáng),可預(yù)測(cè)性普遍大于92%;活動(dòng)半徑大于10 km的樣本,可預(yù)測(cè)性與活動(dòng)半徑之間相關(guān)性較弱。
居民活動(dòng)的可預(yù)測(cè)性在一日之內(nèi)具有比較明顯的變化規(guī)律。本文以小時(shí)為單元,進(jìn)行時(shí)間分段,計(jì)算每個(gè)時(shí)間段居民活動(dòng)的可預(yù)測(cè)性,得到可預(yù)測(cè)性的日變化規(guī)律圖(圖7)。從圖7中可以看出,居民活動(dòng)一日之內(nèi)的可預(yù)測(cè)性呈現(xiàn)雙谷分布,兩個(gè)低谷分別出現(xiàn)在7:00-10:00和17:00-20:00,最低值(74%)出現(xiàn)在8:00-9:00,說(shuō)明在這兩個(gè)時(shí)段內(nèi),居民受到的制約性較小,活動(dòng)彈性較大,活動(dòng)的規(guī)律性較低。兩個(gè)相對(duì)平穩(wěn)的時(shí)段為10:00-17:00和23:00-6:00,可預(yù)測(cè)性分別維持在85%和接近100%的水平,居民日?;顒?dòng)中的工作和睡眠往往發(fā)生在這兩個(gè)時(shí)段內(nèi),因此可預(yù)測(cè)性相對(duì)較高也較為穩(wěn)定。
本研究對(duì)709個(gè)樣本進(jìn)行可預(yù)測(cè)性計(jì)算,并探討其規(guī)律性。結(jié)果顯示,居民活動(dòng)行為具有很強(qiáng)的可預(yù)測(cè)性,活動(dòng)半徑在10 km以內(nèi)的居民移動(dòng)行為可預(yù)測(cè)性普遍在92%以上;進(jìn)一步分析發(fā)現(xiàn),居民活動(dòng)行為的可預(yù)測(cè)性與活動(dòng)半徑存在顯著的相關(guān)關(guān)系;居民一日之內(nèi)的活動(dòng)行為可預(yù)測(cè)性具有明顯的時(shí)間節(jié)律,呈現(xiàn)雙波谷的變化特征。
從方法論看,本文基于時(shí)空間行為研究范疇內(nèi)的個(gè)體活動(dòng)慣常性與制約性,在非匯總層面對(duì)個(gè)體的活動(dòng)特征進(jìn)行討論。這一研究提供了一個(gè)更人本化、精細(xì)化的城市交通預(yù)測(cè)研究視角。研究結(jié)果表明:盡管居民的時(shí)空間活動(dòng)是自發(fā)的和多變的,但事實(shí)上因?yàn)橹萍s性和慣常性的存在,活動(dòng)行為具有非常強(qiáng)的規(guī)律性和可預(yù)測(cè)性。基于這樣的認(rèn)識(shí),當(dāng)本文涉及災(zāi)害分析、城市規(guī)劃、交通管理、市政管理等領(lǐng)域的實(shí)踐時(shí),精確地對(duì)居民時(shí)空間活動(dòng)進(jìn)行預(yù)測(cè)便具有科學(xué)的依據(jù)。
本研究仍存在一定的不足。方法上,將樣本的每一個(gè)坐標(biāo)點(diǎn)當(dāng)做一個(gè)孤立點(diǎn)看待,沒(méi)有考慮樣本活動(dòng)時(shí)序特征對(duì)于可預(yù)測(cè)性的影響,即未將居民活動(dòng)的時(shí)序規(guī)律性納入研究框架,下一步有待完善;研究?jī)?nèi)容上,本文只探討了居民活動(dòng)可預(yù)測(cè)性的度量方式和現(xiàn)象規(guī)律,對(duì)于行為主體屬性以及導(dǎo)致這一現(xiàn)象背后的原因分析不足。下一階段,要結(jié)合居民的社會(huì)經(jīng)濟(jì)屬性,探討不同類型人群所呈現(xiàn)的可預(yù)測(cè)性的規(guī)律性及背后的成因,為個(gè)性化的居民出行引導(dǎo)以及智慧化的城市規(guī)劃管理服務(wù)。
[1] JONES P,CLARKE M.The significance and measurement of variability in travel behavior[J].Transportation,1988,15:65-87.
[2] 郭文伯,張艷,柴彥威,等.基于GPS數(shù)據(jù)的城市郊區(qū)居民日?;顒?dòng)時(shí)空特征——以北京天通苑、亦莊為例[J].地域研究與開(kāi)發(fā),2013(6):159-164.
[3] 申悅,柴彥威.基于GPS數(shù)據(jù)的北京市郊區(qū)巨型社區(qū)居民日?;顒?dòng)空間[J].地理學(xué)報(bào),2013(4):506-516.
[4] 申悅,柴彥威,郭文伯.北京郊區(qū)居民一周時(shí)空間行為的日間差異[J].地理研究,2013(4):701-710.
[5] 申悅,柴彥威.基于GPS數(shù)據(jù)的城市居民通勤彈性研究——以北京市郊區(qū)巨型社區(qū)為例[J].地理學(xué)報(bào),2012(6):733-744.
[6] KWAN M-P.Interactive geovisualization of activity-travel patterns using three-dimensional geographical information sys-tems:A methodological exploration with a large data set[A].Transportation Research Part C[C].2000.185-203.
[7] SCHWANEN T,KWAN M-P,REN F.How fixed is fixed?Gendered rigidity of space-time constraints and geographies of everyday activities[A].Geoforum,2008.2109-2121.
[8] LONG Y,LIU X J,ZHOU J P,et al.Early birds,night owls,and tireless/recurring itinerants:An exploratory analysis of extreme transit behaviors in Beijing,China[J].Physics and Society,CoRR abs/1502.02056(2015).
[9] 柴彥威.時(shí)空間行為研究前沿[M].南京:東南大學(xué)出版社,2015.
[10] SONG C,QU Z,BLUMM N,et al.Limits of predictability in human mobility[J].Science,2010,327(5968):1018-1021.
[11] SONG C,KOREN T,WANG P,et al.Modelling the scaling properties of human mobility[J].Nature Physics,2010,6(10):818-823.
[12] LU X,WETTER E,BHARTI N,et al.Approaching the limit of predictability in human mobility[R].Scientific Reports,2013.3.
[13] LU X,BENGTSSON L,HOLME P.Predictability of population displacement after the 2010 Haiti earthquake[J].Proceedings of the National Academy of Sciences,2012,109(29):11576-11581.
[14] 王進(jìn),史其信.神經(jīng)網(wǎng)絡(luò)模型在短期交通流預(yù)測(cè)領(lǐng)域應(yīng)用綜述[J].河南科技大學(xué)學(xué)報(bào)(自然科學(xué)版),2005(2):22-26.
[15] 姜桂艷,常安德,牛世峰,等.基于BP神經(jīng)網(wǎng)絡(luò)的交通數(shù)據(jù)序列動(dòng)態(tài)可預(yù)測(cè)性分析方法[J].北京工業(yè)大學(xué)學(xué)報(bào),2011(7):1019-1026.
[16] 姜桂艷,常安德,李琦,等.基于出租車GPS數(shù)據(jù)的路段平均速度估計(jì)模型[J].西南交通大學(xué)學(xué)報(bào),2011(4):638-644.
[17] 劉瑜,肖昱,高松,等.基于位置感知設(shè)備的人類移動(dòng)研究綜述[J].地理與地理信息科學(xué),2011,27(4):8-13.
[18] 周濤,韓筱璞,閆小勇,等.人類行為時(shí)空特性的統(tǒng)計(jì)力學(xué)[J].電子科技大學(xué)學(xué)報(bào),2013(4):481-540.