陳 偉,翟國方,張義杰
(1.南京郵電大學(xué) 地理與生物信息學(xué)院 江蘇 南京 210046;2.南京大學(xué) 建筑與城市規(guī)劃學(xué)院,江蘇 南京 210093; 3.南京財經(jīng)大學(xué) 工商管理學(xué)院,江蘇 南京 210046)
城市人口分布是城市規(guī)劃、公共服務(wù)設(shè)施配置、各項政策制定等工作的重要依據(jù),掌握精細(xì)尺度下的人口分布信息可為科學(xué)合理地決策提供詳細(xì)的量化基礎(chǔ)[1]。由于人口在城市中的分布具有范圍和時間上的雙重不確定性,這給準(zhǔn)確分析其空間分布狀態(tài)帶來了較大困難[2]。在傳統(tǒng)的人口密度方法中,根據(jù)研究區(qū)域尺度和問題的不同,涉及的主要數(shù)據(jù)類型有人口普查數(shù)據(jù)[3]、土地利用數(shù)據(jù)[4]、遙感影像數(shù)據(jù)[5]、專項調(diào)查數(shù)據(jù)[6]等,數(shù)據(jù)不同程度地在時效性、誤差控制等方面存在不足。此外,評估結(jié)果多是靜態(tài)的,且空間統(tǒng)計單元較大,無法滿足細(xì)化的使用需求。大數(shù)據(jù)時代的到來給上述問題的解決帶來了契機(jī),結(jié)合多源數(shù)據(jù)類型對人口分布和變化趨勢展開分析與模擬逐漸成為較可靠的方法[7-9]。
除傳統(tǒng)的密度法以外,當(dāng)前城市人口分布研究的方法可總結(jié)為兩大類:首先是基于密度法的各種改進(jìn)方法,由于大數(shù)據(jù)的獲取具有一定難度,研究中仍需要建立基本的人口密度柵格,然后通過構(gòu)建模型方法對結(jié)果進(jìn)行優(yōu)化。戚偉等利用土地利用類型數(shù)據(jù),通過“人口—晝夜—土地利用”關(guān)系模型和人口空間化模型,對格網(wǎng)單元的城市晝夜人口空間分布特征進(jìn)行了分析[10];胡曾曾等基于公里網(wǎng)格人口分布數(shù)據(jù),運用CA-Markov模型模擬了北京市2015—2030年4期公里網(wǎng)格的人口,并以街道尺度的人口數(shù)據(jù)驗證了模擬結(jié)果[11];康停軍等通過多智能體模擬實驗獲得了較高空間精度的城市人口分布,模擬的城市居住分異現(xiàn)象基本符合實際情況[12];凡宸等針對人口統(tǒng)計數(shù)據(jù)的空間單元較大的現(xiàn)實情況,采取一元與多元回歸方法在GIS平臺實現(xiàn)了人口密度的降尺度模擬,得到了200m柵格尺度人口數(shù)據(jù)[13]。第二類為結(jié)合大數(shù)據(jù)的人口分布分析方法,包括間接模擬和直接計算。前者代表為基于夜間燈光數(shù)據(jù)的人口模擬,原理與密度法相似,缺點是空間精度仍不足,可驗證性較差,但相較傳統(tǒng)方法已能定量反映出人口的實際空間集聚情況[14-16];后者代表為結(jié)合手機(jī)信令數(shù)據(jù)的人口分布評估。由于信令數(shù)據(jù)能較真實地表征城市人口的分布狀態(tài),具有時效性強(qiáng)、覆蓋面廣等特征,被用于人口空間行為、人口流動、城市熱點片區(qū)識別等方面的研究,結(jié)果可信度較高[17-21]。里克西多等在研究中開發(fā)了一種用于收集和處理基于多個運營商網(wǎng)絡(luò)數(shù)據(jù)的方法框架,解決了利用移動電話數(shù)據(jù)來評估泛歐人口密度分布的問題[22];龍奮杰等以貴陽市觀山湖公園為例,結(jié)合手機(jī)信令數(shù)據(jù)對公園服務(wù)人數(shù)、服務(wù)時長等展開了評價,反映了城市公園的實際服務(wù)狀態(tài),避免了傳統(tǒng)方法缺少數(shù)據(jù)檢驗的不足[23];黃建華等、鐘煒菁等分別利用信令數(shù)據(jù)對上海市人流時空分布與移動模式[24]、人口分布與空間活動的動態(tài)特征[25]進(jìn)行了研究。
鑒于此,本文基于電信手機(jī)信令數(shù)據(jù),以天津市小白樓CBD片區(qū)為例,運用Python語言處理數(shù)據(jù)并設(shè)計人員分析模型識別駐留與流動人員屬性,結(jié)合GIS對區(qū)域人員規(guī)模總體變化趨勢、分地塊人數(shù)極值時空分布、駐留與流動人員時空分布進(jìn)行了分析,以期為涉及人口分布的城市問題研究提供參考。
案例區(qū)域位于天津市中心城區(qū),屬小白樓CBD組成部分,面積約13.47km2。區(qū)域內(nèi)及附近的主要設(shè)施與重要功能片區(qū)有天津站、意式風(fēng)情街區(qū)、海河文化廣場、和平路商業(yè)街、中心公園、靜園、五大道文化旅游區(qū)、天津總醫(yī)院、天津財經(jīng)大學(xué)、天津外國語大學(xué)、天津醫(yī)科大學(xué)、天津大學(xué)等,有4條地鐵線從片區(qū)內(nèi)部穿過,分別為1號線、2號線、3號線、津濱輕軌地鐵9號線,共有站點9處。據(jù)調(diào)查,片區(qū)內(nèi)建筑較密集,傳統(tǒng)風(fēng)情街區(qū)尤甚,低層建筑與高層建筑集中區(qū)的邊界區(qū)分明顯。(超)高層建筑主要分布于小白樓地區(qū)、海河沿岸兩側(cè)和營口道地鐵站附近。總體上,研究區(qū)域是一處典型的高建筑密度、高人口密度的城市中心區(qū)。
圖1 按用戶ID去重(a)與按坐標(biāo)計數(shù)(b)的結(jié)果(11月10日15∶00)
本文所使用的手機(jī)信令數(shù)據(jù)來源于中國電信,數(shù)據(jù)時間跨度為2016年11月1日—11月30日,共計51694631條數(shù)據(jù),每一條數(shù)據(jù)都包含了用戶ID(手機(jī)號加密后)、坐標(biāo)和活動時間信息。由于數(shù)據(jù)中涉及龐大的重復(fù)用戶ID及相同坐標(biāo)用戶,需要對數(shù)據(jù)進(jìn)行清洗、去除重復(fù)項、相同坐標(biāo)用戶計數(shù)等預(yù)處理,以在不影響數(shù)據(jù)質(zhì)量的前提下減小數(shù)據(jù)體量,便于在GIS中進(jìn)行分析,提升運行速度。此外,為了掌握人口的高精度時空分布情況,將每一天數(shù)據(jù)以小時為單位進(jìn)行分割,則30天內(nèi)共計720份分時數(shù)據(jù)。以上數(shù)據(jù)預(yù)處理過程均通過Python語言編程實現(xiàn)。本文以11月10日15∶00的數(shù)據(jù)(包括分布于15∶00—15∶59區(qū)間的所有數(shù)據(jù))為例,提取的原始數(shù)據(jù)見圖1a,去重后總計62989個點(人),同一個位置存在較多的用戶ID,且這種現(xiàn)象較普遍,不利于數(shù)據(jù)的快速處理分析。在點的位置保持不變的情況下按相同坐標(biāo)進(jìn)行計數(shù),將數(shù)據(jù)導(dǎo)入GIS以發(fā)現(xiàn),點的數(shù)量降至2936個,人數(shù)仍為62989人,即圖1b中的每個點都帶有人員數(shù)量屬性,初步呈現(xiàn)了人員活動的“熱點”區(qū)域。
在數(shù)據(jù)預(yù)處理中,尚未區(qū)分區(qū)域內(nèi)的駐留人員與流動人員,而人員的駐留或流動屬性識別對掌握區(qū)域人員構(gòu)成及其空間分布至關(guān)重要。本研究通過構(gòu)建基于手機(jī)信令數(shù)據(jù)的人員分析模型進(jìn)行分析,模型以Python語言編程實現(xiàn),在Anaconda Navigator(Spyder)中進(jìn)行運算。
根據(jù)本研究中手機(jī)信令數(shù)據(jù)的記錄規(guī)則與統(tǒng)計分析,若某個用戶的ID一天之內(nèi)出現(xiàn)的次數(shù)大于6次,且在區(qū)域內(nèi)停留的時間超過4h,則將其標(biāo)記為駐留人員;若出現(xiàn)次數(shù)小于6次或在區(qū)域內(nèi)停留的時間小于4h,則將其視為流動人員。若某個用戶的ID僅在7—19點之間出現(xiàn),出現(xiàn)次數(shù)大于6次,且在區(qū)域內(nèi)停留的時間超過4h,則將其標(biāo)記為白天駐留人員;若僅在7點之前或19點之后出現(xiàn),出現(xiàn)次數(shù)大于6次,且在區(qū)域內(nèi)停留的時間超過4h,則將其視為夜間駐留人員。若某個用戶的ID僅在7—19點之間出現(xiàn),出現(xiàn)次數(shù)小于6次,或在區(qū)域內(nèi)停留的時間小于4h,則將其標(biāo)記為白天流動人員;若僅在7點之前或19點之后出現(xiàn),出現(xiàn)次數(shù)小于6次,或在區(qū)域內(nèi)停留的時間小于4h,則將其視為夜間流動人員。某個用戶在區(qū)域內(nèi)的最終坐標(biāo)以該用戶ID出現(xiàn)次數(shù)最多的坐標(biāo)來表示。
PN={PN1,PN2,…,PNn}為用戶ID的集合,其中N={1,2,…,n};Lj={Lj1,Lj2,…,Ljkj}為用戶PNj出現(xiàn)位置坐標(biāo)集合,其中Kj={1,2,…,kj},j∈N(下同);Tj={Tj1,Tj2,…,Tjhj}為用戶PNj出現(xiàn)時間的集合,其中Hj={1,2,…,hj};Cji為用戶PNj的坐標(biāo)Lji的出現(xiàn)次數(shù),i∈Kj(下同),那么Cj={Cj1,Cj2,…,Cjkj}為用戶PNj不同坐標(biāo)出現(xiàn)次數(shù)的集合;cj為用戶PNj的出現(xiàn)次數(shù);tj為用戶PNj第一次出現(xiàn)到最后一次出現(xiàn)的時間間隔,以小時為單位;Aj為虛擬變量,表示用戶PNj的身份屬性,0表示流動人員,1表示駐留人員;Bj為虛擬變量,表示用戶PNj是否為白天駐留人員,0為是,1為否。
統(tǒng)計用戶PNj不同坐標(biāo)的出現(xiàn)次數(shù),由此可知該用戶出現(xiàn)次數(shù)為:
(1)
用戶PNj第一次出現(xiàn)到最后一次出現(xiàn)的時間間隔為:
tj=max(Tj)-min(Tj)
(2)
通過cj和tj的值判斷該用戶ID是否為駐留人員,即Aj的值為:
(3)
當(dāng)Aj=1時:
(4)
某用戶的最終坐標(biāo)以該用戶ID出現(xiàn)次數(shù)最多的坐標(biāo)來表示,即當(dāng)Cji=max(Cj)時,此時的坐標(biāo)Lji便為用戶PNj的坐標(biāo)。
本文對11月1日每個小時段的人員規(guī)模進(jìn)行統(tǒng)計發(fā)現(xiàn),一天內(nèi)的區(qū)域總?cè)丝跀?shù)量呈現(xiàn)出“平穩(wěn)降低(0∶00—4∶00)—快速升高(5∶00—8∶00)—平穩(wěn)升高(9∶00—17∶00)—快速降低(19∶00—23∶00)”的總體趨勢。
0∶00—4∶00時間段的區(qū)域內(nèi)總?cè)藬?shù)平穩(wěn)中有所減少,主要是流動人員活動強(qiáng)度逐漸降低的緣故。區(qū)域內(nèi)的工作人員、路過的通勤人員和其他流動人員的增加,5∶00—8∶00時間段的總?cè)藬?shù)快速增多。而流動人員活動導(dǎo)致區(qū)域內(nèi)人數(shù)在9∶00—17∶00時間段平穩(wěn)增加,17∶00達(dá)到最大。18∶00之后,區(qū)域內(nèi)總?cè)藬?shù)快速降低(圖2)。11月2日—11月30日的人員規(guī)模變化趨勢與11月1日相似。
圖2 11月1日分時間段區(qū)域總?cè)藛T規(guī)模統(tǒng)計
從一周內(nèi)相同時間段的平均人員規(guī)模變化趨勢看,周五全天的平均總?cè)藬?shù)較多,17∶00后的增勢尤為明顯,主要由通勤人員、休閑娛樂人員等在內(nèi)的流動人員活動強(qiáng)度較大所致;周六、周日上午在7∶00—10∶00時間段的平均總?cè)藬?shù)均較周一至周五少,這是由其區(qū)域功能特性決定的;11∶00—14∶00時間段的人員數(shù)量基本與周一至周五同時段規(guī)模保持齊平,而隨著區(qū)域內(nèi)下午和晚間休閑娛樂人員的快速增加,總?cè)藬?shù)規(guī)模增加明顯,尤其是周六的16∶00之后;周一至周四的區(qū)域人口變化情況較相似,其中周二18∶00之后的平均人員規(guī)模較其他3天少(圖3)。
圖3 周一至周日相同時間段平均人員規(guī)模變化趨勢
人數(shù)極值的時空分布分析可幫助了解人員活動的“熱點”與“冷點”地塊,我們對720個時間段的各個地塊人員數(shù)量最大值及其出現(xiàn)時間進(jìn)行統(tǒng)計分析發(fā)現(xiàn),總體上除0∶00、1∶00、6∶00、7∶00以外的所有時間段出現(xiàn)人數(shù)最大值地塊的人數(shù)低值均較小,同時段的地塊人數(shù)高值與人數(shù)低值差異較大,變動較劇烈;0∶00—7∶00時間段的人數(shù)最大值地塊數(shù)量與地塊總?cè)藬?shù)均較少,表明此時區(qū)域內(nèi)沒有明顯的人員流入;8∶00—19∶00時間段的人數(shù)最大值地塊數(shù)量、地塊總?cè)藬?shù)和地塊平均人數(shù)均較多,反映出區(qū)域內(nèi)白天的人員活動強(qiáng)度顯著高于夜間。此外,在8∶00和17∶00早晚高峰時段出現(xiàn)人數(shù)最大值地塊的人數(shù)高值均較鄰近時段大;20∶00—22∶00時間段的最大值地塊數(shù)量與地塊總?cè)藬?shù)不及8∶00—19∶00時間段多,但21∶00后的地塊平均人數(shù)有所回升,說明此時有部分地塊(如居住地塊)集聚了一定數(shù)量的人員(表1)。
表1 人數(shù)最大值地塊的出現(xiàn)時間及相關(guān)信息統(tǒng)計
從人數(shù)最大值地塊出現(xiàn)的時間段分布統(tǒng)計來看,0∶00—6∶00時間段的人數(shù)最大值地塊數(shù)量僅占總數(shù)的0.68%,而6∶00—18∶00時間段的占比達(dá)到了87.91%,18∶00—0∶00時間段的占比為11.41%(圖4)。
圖4 各時間段人數(shù)最大值地塊數(shù)量及占比
按照周一至周日的日期統(tǒng)計發(fā)現(xiàn),周五出現(xiàn)的人數(shù)最大值地塊數(shù)量、地塊總?cè)藬?shù)及地塊平均人數(shù)均較多,周三、周二、周四分別次之,周一較少;周六、周日出現(xiàn)的人數(shù)最大值地塊數(shù)量為32個,但周六的地塊總?cè)藬?shù)、地塊平均人數(shù)較多。總體上,地塊人數(shù)的高值與低值的變動較為劇烈(表2)。
表2 周一至周日人數(shù)最大值地塊信息統(tǒng)計
對人數(shù)最小值地塊的分析發(fā)現(xiàn),在720個時間段內(nèi),最小值為0的地塊有217個,小于10人的地塊有249個,大于10人的地塊有49個;有44個地塊在超過1/2的時間段中最小人數(shù)為0,僅有80個地塊在全部時間段均顯示有人員活動??傮w上,超過95%的地塊于晚間出現(xiàn)人數(shù)最小值,其中在1∶00出現(xiàn)的人數(shù)最小值地塊數(shù)量最多,為142個,占比達(dá)48%;22∶00、2∶00、4∶00、3∶00、0∶00時間段出現(xiàn)的地塊數(shù)量分別次之(圖5)。
圖5 人數(shù)最小值地塊的出現(xiàn)時間及地塊數(shù)量、占比
地塊最大人數(shù)分布及最大人數(shù)出現(xiàn)的時間見圖6。從圖6可見,天津站及其周邊地區(qū)、大王莊地鐵站、十一經(jīng)路地鐵站至海河之間的區(qū)域、小白樓地區(qū)、和平路商業(yè)街、營口道地鐵站及其周邊地區(qū)等片區(qū)的地塊人數(shù)最大值均較高,屬于人員活動熱點區(qū)域(圖6a)。地塊人數(shù)最大值出現(xiàn)的時間見圖6,即出現(xiàn)數(shù)據(jù)極值的具體日期與時間段。
源數(shù)據(jù)既包含區(qū)域內(nèi)的駐留人員,如工作人員、居住人員等,也有非區(qū)域內(nèi)的通勤人員、休閑人員、旅客等流動人員,且流動人員較多。為掌握駐留、流動人員在區(qū)域內(nèi)的變化趨勢與空間分布情況,運用前文構(gòu)建的人員分析模型識別人員屬性,結(jié)果發(fā)現(xiàn)除了11月4日、19日的人員變化較為劇烈以外,駐留、流動人員數(shù)量的變化趨勢總體上呈現(xiàn)出以下特征:①不論是在白天還是夜間,駐留人員和流動人員各自的總規(guī)模略有變化但相對平緩;②全天的流動人員規(guī)模遠(yuǎn)大于駐留人員規(guī)模;③白天的流動人員規(guī)模遠(yuǎn)大于夜間流動人員規(guī)模;④夜間駐留人員規(guī)模大于白天駐留人員規(guī)模(圖7)。
圖6 地塊最大人數(shù)(a)及最大人數(shù)出現(xiàn)時間(b)
圖7 11月1日—11月30日大于/小于4h停留時間人數(shù)變化趨勢
本文將模型計算結(jié)果導(dǎo)入GIS以分析各個地塊的駐留、流動人員數(shù)量,具體包括白天駐留人員、夜間駐留人員、白天流動人員及夜間流動人員,以11月1日的地塊二為例,對應(yīng)的人數(shù)分別為725人、1275人、1103人、545人,說明該地塊在白天的人員流動性較大,而夜間駐留人員數(shù)量多于白天,表明可能含有居住建筑。對11月2日—11月30日的數(shù)據(jù)繼續(xù)展開分析,各地塊停留時間大于或小于4h的30天平均人數(shù)見表3。
表3 各地塊大于/小于4h停留時間人數(shù)統(tǒng)計(30天平均)
在空間分布方面,夜間駐留人員的空間分布差異較白天駐留人員而言更為明顯,總?cè)藛T規(guī)模也較大,多分布于天津站及周邊地區(qū)、大王莊地鐵站、十一經(jīng)路地鐵站至海河之間的區(qū)域、營口道地鐵站及其周邊地區(qū)等;夜間流動人員的空間分布差異較白天明顯,但流動人員總規(guī)模遠(yuǎn)不及白天。總體上,區(qū)域內(nèi)全天的駐留人員與流動人員在空間分布上存在著一定的關(guān)聯(lián)特征,即駐留人員多的地方流動人員也較多,局部地區(qū)略有差異,但人員規(guī)模差距較大(流動人員多)。對熱點地塊來說,駐留人員與流動人員的規(guī)模均普遍較其他地塊大(圖8)。
由于使用電信服務(wù)的人員數(shù)量在研究區(qū)域內(nèi)的占比未知,已分析的地塊人員規(guī)模并不能代表其全部人員數(shù)量。結(jié)合圖7的分析過程可知,基于電信手機(jī)信令數(shù)據(jù)分析得出的夜間平均駐留人數(shù)為24557人,而根據(jù)區(qū)域內(nèi)帶戶數(shù)信息的小區(qū)、公寓、宿舍等居住建筑分布情況的POI數(shù)據(jù),估算出夜間總居住人口約263539人。前者與后者的比值即近似為區(qū)域內(nèi)電信服務(wù)的市場占比,約為9.32%,將所有日期的白天駐留人員、白天流動人員、夜間駐留人員、夜間流動人員分別按照此比例進(jìn)行校正,即可得到各自的實際人員規(guī)模。
圖8 大于4h(a)與小于4h(b)停留時間人員的總體分布(30天平均)4 結(jié)論
基于手機(jī)信令數(shù)據(jù),運用Python語言編程和GIS對天津市小白樓CBD片區(qū)的高精度人口時空分布特征進(jìn)行了探索,主要結(jié)論為:①區(qū)域人口規(guī)模在研究時段內(nèi)遵循“平穩(wěn)降低(0∶00—4∶00)—快速升高(5∶00—8∶00)—平穩(wěn)升高(9∶00—17∶00)—快速降低(19∶00—23∶00)”的總體變化趨勢。從一周內(nèi)相同時間段的平均人員規(guī)模變化趨勢來看,周一至周四的人口變化情況較相似,其中周二18∶00之后的平均人員規(guī)模較其他3天少;周五全天的平均總?cè)藬?shù)最多,17∶00后的增勢尤為明顯;周六、周日上午在7∶00—10∶00時間段的平均總?cè)藬?shù)均較周一至周五少,11∶00—14∶00時間段的人員數(shù)量基本與周一至周五同時段規(guī)模保持一致,而下午和晚間總?cè)藬?shù)規(guī)模增加明顯,尤其是周六的16∶00之后。②在720個時間段內(nèi),于6∶00—18∶00時間段出現(xiàn)人數(shù)最大值地塊的數(shù)量占比達(dá)到了87.91%,空間上主要分布于天津站及其周邊地區(qū)、大王莊地鐵站、十一經(jīng)路地鐵站至海河之間的區(qū)域、小白樓地區(qū)、和平路商業(yè)街、營口道地鐵站及其周邊地區(qū)等片區(qū)。同時,該時段的地塊平均人數(shù)較多,反映出區(qū)域內(nèi)白天的人員活動強(qiáng)度明顯高于夜間。此外,在8∶00和17∶00早晚高峰時段出現(xiàn)人數(shù)最大值地塊的人數(shù)高值均較鄰近時段大。總體上,周五出現(xiàn)的人數(shù)最大值地塊數(shù)量、地塊總?cè)藬?shù)及地塊平均人數(shù)均較多,周三、周二、周四分別次之。對人數(shù)最小值地塊的分析發(fā)現(xiàn),有44個地塊在超過1/2的時間段中最小人數(shù)為0,僅有80個地塊在全部時間段均顯示有人員活動。在時間分布方面,超過95%的地塊于晚間出現(xiàn)人數(shù)最小值,其中在1∶00出現(xiàn)的人數(shù)最小值地塊數(shù)量最多。③駐留與流動人員數(shù)量的變化趨勢呈現(xiàn)出各自在白天和夜間的總規(guī)模略有變化但相對較為平緩,全天的流動人員規(guī)模遠(yuǎn)大于駐留人員規(guī)模,白天的流動人員規(guī)模遠(yuǎn)大于夜間流動人員規(guī)模,夜間駐留人員規(guī)模大于白天駐留人員規(guī)模等顯著特征。在空間分布方面,區(qū)域內(nèi)全天的駐留人員與流動人員存在著一定的關(guān)聯(lián)特征,即駐留人員多的地方流動人員也較多,局部地區(qū)略有差異。夜間駐留人員多分布于天津站及其周邊地區(qū)、大王莊地鐵站、十一經(jīng)路地鐵站至海河之間的區(qū)域、營口道地鐵站及其周邊地區(qū)等,空間分布差異較白天駐留人員而言更為明顯,人員規(guī)模也較大;夜間流動人員的空間分布差異也較白天明顯,但總規(guī)模遠(yuǎn)不及白天。