吳華意,胡秋實,李 銳,劉朝輝
1. 武漢大學(xué)測繪遙感信息工程國家重點實驗室,湖北 武漢 430079; 2. 湖北珞珈實驗室,湖北 武漢 430079; 3. 地球空間信息技術(shù)協(xié)同創(chuàng)新中心,湖北 武漢 430079
人口是指生活在特定社會制度、特定地域具有一定數(shù)量和質(zhì)量的人的總稱[1]。城市人口則是將生活區(qū)域限定在某個城市范圍,是構(gòu)成該城市的社會主體,與城市活動密切相關(guān)。隨著城市的出現(xiàn)和城市化進程的推進,大量的人口流入城市,有力推動了城市的發(fā)展和繁榮。但城市人口數(shù)量的激增也帶來了很多問題,如城市交通堵塞、城市服務(wù)設(shè)施不足、城市環(huán)境惡化等[2]。城市人口是一把雙刃劍,是城市發(fā)展中的核心和最為活躍的因素[3],對城市的規(guī)劃與管理本質(zhì)上是對人口信息的獲取和管理,這就需要掌握城市人口在不同時間點上位于城市各地區(qū)中的分布狀況,即城市人口的時空分布。實踐表明,準(zhǔn)確的人口時空信息,是城市規(guī)劃、應(yīng)急管理、交通出行、疾病防控等城市管理與社會服務(wù)的科學(xué)依據(jù)[4],因此對城市人口分布的估計和研究是城市地理學(xué)需要解決的熱點問題和基礎(chǔ)性研究[5]。
傳統(tǒng)的城市人口分布數(shù)據(jù)主要通過調(diào)研統(tǒng)計的方式獲得,例如,各個國家政府主要通過人口普查的方式獲得行政管理區(qū)域內(nèi)的人口分布信息。然而,人口普查在統(tǒng)計方式和成果應(yīng)用方面存在較多的不足,主要體現(xiàn)為:①人口普查的方法對于人力和物力成本消耗較大,不能頻繁開展,因此兩次人口普查的間隔周期較長,無法形成時間上較為連續(xù)的人口分布數(shù)據(jù)[6];②人口普查數(shù)據(jù)的成果空間化方法是固定的,主要以行政管理屬性的單元呈現(xiàn),對于如交通、城市功能等多樣化場景應(yīng)用的適應(yīng)能力較弱;③公開獲取的人口普查數(shù)據(jù)一般以縣區(qū)為單位,空間粒度較大,且城市中心和郊區(qū)的行政單元面積存在差異,在表達更精細(xì)且空間連續(xù)性較平滑的人口分布信息的能力上存在缺陷[7]。因此,為了在傳統(tǒng)普查手段之外獲取城市人口分布數(shù)據(jù),國內(nèi)外的研究者應(yīng)用不同的方法和模型獲取了不同時空分辨率的城市人口分布情況,相關(guān)成果不僅提高了城市人口分布估計的準(zhǔn)確率和精細(xì)化程度,也推動了相關(guān)研究理論和應(yīng)用的發(fā)展,同時在城市建設(shè)、交通規(guī)劃、公共管理、綜合治理等應(yīng)用領(lǐng)域產(chǎn)生了廣泛而積極的影響。
部分學(xué)者對城市人口時空分布的相關(guān)研究從不同角度已經(jīng)做了一定的總結(jié)。文獻[8]針對基于美國住房單元(house unite,HU)進行人口估計的研究,從建模數(shù)據(jù)、方法和應(yīng)用等方面進行了總結(jié),并提出準(zhǔn)確的住房單元人口需要持續(xù)獲取正確的住房空間單元和行政邊界。文獻[6—7,9]主要從模型和方法的角度總結(jié)了基于遙感和地理信息技術(shù)的人口空間分布估計的研究,并且提出人口分布估計需要與自然、經(jīng)濟因素相結(jié)合,同時要考慮特征和模型的選擇。文獻[10]主要針對利用遙感數(shù)據(jù)進行人口分布估計的國內(nèi)外研究進行了總結(jié),并提出目前估計的人口主要是居住人口,未來的研究應(yīng)著重考慮白天實際的活動人口。文獻[11]從人口統(tǒng)計數(shù)據(jù)空間化的角度,分析比較了10個主要模型的優(yōu)劣,并提出人口分布城市中應(yīng)加強社區(qū)級精細(xì)化尺度的研究,并考慮理論模型和統(tǒng)計模型的結(jié)合。文獻[12]主要針對建模中使用的方法、參考要素對人口空間分布研究進行了總結(jié),并提出未來研究應(yīng)考慮多源遙感數(shù)據(jù)和新型傳感器數(shù)據(jù)的使用。本文基于已有的研究總結(jié)成果,從城市人口分布的空間劃分單元、模型與方法、城市應(yīng)用等角度對相關(guān)研究進行了綜合論述,在模型與方法中著重補充了針對動態(tài)人口和近年來最新的研究成果。
為了揭示城市人口分布估計在理論研究和應(yīng)用方面的進展,本文以城市人口時空分布估計的關(guān)鍵點為核心展開綜述:①從空間劃分的角度介紹城市人口時空分布估計在空間單元構(gòu)建上的研究現(xiàn)狀;②介紹城市人口時空分布估計在模型與方法上的進展,從靜態(tài)和動態(tài)人口的角度對其進行分類并詳細(xì)闡述;③介紹城市人口時空分布估計的典型應(yīng)用狀況;④論述目前研究當(dāng)中存在的不足和局限,并對未來的研究方向提出展望。
城市人口空間分布單元是開展人口時空分布估計時,在空間上劃分的基本空間對象。不同的劃分方式?jīng)Q定了人口分布數(shù)據(jù)獲取方式、可視化的效果和應(yīng)用范圍,是方法模型構(gòu)建和應(yīng)用的基礎(chǔ),并影響人口分布信息表達的精細(xì)度和準(zhǔn)確度。因此,適宜的空間分布單元劃分方法對于有效估計人口分布信息,進而支撐城市相關(guān)應(yīng)用是至關(guān)重要的。在長期的城市人口研究中,已經(jīng)使用或劃分了多種空間單元,根據(jù)人口時空分布估計的空間尺度目標(biāo)、應(yīng)用場景的空間屬性,以及估計模型使用的研究數(shù)據(jù)形式等需求,主要的劃分方法分為3個方向:①基于空間尺度的單元劃分;②基于應(yīng)用場景空間屬性的單元劃分;③基于建模數(shù)據(jù)結(jié)構(gòu)形式的單元劃分。
面積和大小是空間分布單元的基本屬性,因此,空間尺度是城市人口時空分布優(yōu)先考慮的研究目標(biāo)和空間分布單元構(gòu)建的基本需求。在長期的城市人口研究中,不同的空間尺度已經(jīng)被城市管理者構(gòu)建和規(guī)劃了多個空間分布單元,相關(guān)的研究能夠直接使用這些單元,以及其中包含的人口和其他屬性信息開展分布估計研究??臻g尺度的標(biāo)準(zhǔn)主要包括宏觀、中觀和微觀3種。
宏觀和中觀的人口時空信息是城市總體規(guī)劃和管理的傳統(tǒng)支撐數(shù)據(jù),相關(guān)研究者?;谠摮叨葮?gòu)建空間單元并開展人口分布估計與研究。行政區(qū)劃是城市中常見的宏觀和中觀單元(圖1(a)),這類空間單元是由國家行政管理分級劃分的空間區(qū)域,具體由國家民政部門進行劃分。行政區(qū)劃是政府發(fā)布人口普查數(shù)據(jù)和社會、經(jīng)濟、文化等其他統(tǒng)計數(shù)據(jù)的基本單元,其中人口普查數(shù)據(jù)是目前權(quán)威的人口分布數(shù)據(jù),因此在相關(guān)研究中通常將人口估計結(jié)果匯總到街道、市轄區(qū)等行政區(qū)劃單元,并以各級行政區(qū)劃中的人口普查數(shù)據(jù)作為結(jié)果驗證標(biāo)準(zhǔn)。文獻[13—14]分別基于4級行政區(qū)和街道結(jié)合人口普查數(shù)據(jù)進行了建模,驗證了多源數(shù)據(jù)特征可以有效提高人口分布估計的精度。文獻[15]為了研究空氣污染的總體影響,基于我國的區(qū)級行政單元的人口普查數(shù)據(jù)和手機信令數(shù)據(jù)評估了常住人口在PM2.5中的實時暴露情況,結(jié)論表明手機信令數(shù)據(jù)反映的受污染人口與人口普查數(shù)據(jù)具有較大差異,需要調(diào)整污染治理的區(qū)域和政策。同時,基于行政區(qū)劃的人口分布研究也對行政區(qū)劃的調(diào)整提供反饋。文獻[16]基于街道級行政單元結(jié)合出租車數(shù)據(jù)分析了城市的人口時空變化情況,并提出北京市區(qū)級行政單元根據(jù)人口分布變化情況應(yīng)進行合并。另外部分研究者為了研究宏觀的人口分布中心,選擇傳統(tǒng)人口密度模型中的人口衰減圈層結(jié)構(gòu)開展研究。文獻[17—18]為了研究城市整體人口空間結(jié)構(gòu),將城市根據(jù)人口密度大小分為中心、近郊和遠(yuǎn)郊3個圈層。文獻[19]以城市的3級交通環(huán)線構(gòu)成了3層城市圈單元并研究城市人口多中心結(jié)構(gòu)(圖1(b))。進一步,隨著人口數(shù)量劇增和城市應(yīng)用場景的多樣化發(fā)展,人口的精細(xì)化管理是目前城市工作重點,傳統(tǒng)行政區(qū)劃單元的空間尺度較大,部分研究者使用建筑物作為空間單元(圖1(c))。建筑物是人工構(gòu)建的地理要素,在二維空間上的面積普遍為幾十米級,并且是人口居住的實際區(qū)域,因此適合表達微觀尺度的人口分布信息。首先,建筑物本身可以提供更加精細(xì)的空間或?qū)傩詳?shù)據(jù)關(guān)聯(lián)人口分布信息。文獻[20—21]為了獲取精細(xì)化的人口分布數(shù)據(jù),使用LiDAR導(dǎo)出的建筑物體積信息建立了基于建筑物的靜態(tài)人口分布估計模型;同時建筑物可以與地名地址[22]、土地利用[23]、夜間燈光[24]、POI[25]等空間地理數(shù)據(jù)相結(jié)合,進而通過對建筑物進行功能分類和空置率識別以提高人口分布估計的精度。文獻[26]為了提高精細(xì)化的人口分布估計精度基于POI數(shù)據(jù)獲取了建筑物單元的功能分類。進一步,由于建筑物是人口居住的實際區(qū)域,可以建立人口分布的強相關(guān)模型。文獻[27]為了研究微觀尺度的人口分布特征,基于建筑物要素結(jié)合多源大數(shù)據(jù)建立了人口-建筑物引力模型。
圖1 基于空間尺度需求的傳統(tǒng)單元劃分示例Fig.1 Examples of unit construction based on spatial scale requirements
上述劃分方法主要針對人口分布估計的空間尺度需求構(gòu)建,其中行政區(qū)劃和城市圈層主要用于宏觀和中觀的人口分布研究,從而獲取城市粗粒度的人口分布信息,但這些單元的尺度相對較大,無法對城市精細(xì)空間進行表達,不能體現(xiàn)人口分布的空間異質(zhì)性。對于建筑物單元,可以表達局部精細(xì)的人口分布信息,并提供高精度的空間信息輔助人口分布估計。但是,建筑物在二維空間上的分布是不連續(xù)的,對于變化頻率較低的靜態(tài)常住人口可以進行表征;而對于變化頻率較高的動態(tài)人口,由于人口并不只聚集在建筑物內(nèi)部空間,建筑物以外的區(qū)域也包含大量人口活動和移動信息,而這部分信息基于建筑物在空間上進行表征會有損失。同時,考慮目前動態(tài)人口研究的數(shù)據(jù)源,在精度上普遍無法獲得建筑物內(nèi)部的活動信息,因此將建筑物作為動態(tài)研究的單元在表征人口活動的能力和研究可行性方面存在一定的缺陷。
應(yīng)用場景是人口分布估計的重要導(dǎo)向,不同的應(yīng)用場景對于人口分布信息的精細(xì)程度和表達方式有多樣化的需求。在空間尺度需求的基礎(chǔ)上,應(yīng)用場景通常需要構(gòu)建具有特定空間屬性或符合場景主題的人口活動空間區(qū)域,進而需要人工構(gòu)建或進行屬性篩選。因此,考慮應(yīng)用場景空間屬性需求是空間分布單元劃分的重要方向。本文列舉了4類典型的應(yīng)用場景,包括城市交通、衛(wèi)生醫(yī)療、功能結(jié)構(gòu)和居住生活。
針對城市交通,相關(guān)研究者通常以城市交通管理部門通過主干道劃分的交通分析區(qū)(traffic analysis zone,TAZ)[28]作為空間單元(圖2(a))。文獻[29]基于TAZ探究城市人口職住和通勤結(jié)構(gòu),分析北京市人口的時空分布和移動情況。文獻[30]基于TAZ和出租車GPS數(shù)據(jù)研究城市人口的動態(tài)分布和出行規(guī)律。進一步地,部分研究者結(jié)合相關(guān)交通設(shè)施開展場景的深入研究。文獻[31]為了研究城市主要交通站點的人口分布變化特征,以公交車站點為中心劃分了緩沖區(qū)作為空間單元。針對城市衛(wèi)生醫(yī)療,研究者通??紤]場景的具體特征和相關(guān)事件劃分空間單元。文獻[32]為了研究新冠病毒的擴散模式,考慮武漢市封閉隔離的主體為住宅小區(qū),同樣以主干道劃分了1140個交通分析區(qū),結(jié)合手機定位數(shù)據(jù)分析人口的空間交互情況。文獻[33—34]基于醫(yī)療設(shè)施和交通網(wǎng)絡(luò)構(gòu)建緩沖區(qū)研究了人口到達公共健康設(shè)施的時空分布特征。針對于城市人口活動功能結(jié)構(gòu),研究者以人口活動的區(qū)域或相似特征的區(qū)域作為空間單元。文獻[35—37]為了識別人口活動功能區(qū),根據(jù)主干道對于人口活動的限制作用將TAZ作為空間單元。文獻[38—39]以多級城市道路網(wǎng)劃分符合人口生活的面狀要素以分析人口活動功能的時空結(jié)構(gòu)。針對人口居住生活,相關(guān)研究者考慮場景典型的代表區(qū)域劃分空間單元。文獻[40]為了探究城市郊區(qū)人口的生活情況,以北京市城郊的多個大型社區(qū)作為空間單元,結(jié)合GPS數(shù)據(jù)分析人口日常活動的空間變化情況。文獻[41—42]選擇了典型的居住區(qū)分別研究了城市人口的職住分離特征和老年貧困人口的分布特征。
總體而言,上述劃分方法從城市應(yīng)用場景出發(fā),根據(jù)應(yīng)用場景的時空特征需求和對人口分布信息的需求構(gòu)建空間單元,能夠準(zhǔn)確獲得支撐應(yīng)用場景的人口分布數(shù)據(jù)。但是,目前基于應(yīng)用場景構(gòu)建的空間單元具有較強的針對性,尤其是短期或局部性場景對于空間區(qū)域?qū)傩院头秶休^多的限制,進而導(dǎo)致單元的普適性和通用性較弱。同時目前對于應(yīng)用場景的需求認(rèn)知缺乏統(tǒng)一的模型和標(biāo)準(zhǔn),無法系統(tǒng)地支撐空間單元的劃分。
多源異構(gòu)的城市時空數(shù)據(jù)是人口分布估計方法建模的重要信息和特征來源,為了準(zhǔn)確提取數(shù)據(jù)中與人口分布信息相關(guān)的特征,避免造成信息丟失和統(tǒng)計偏差,同時進一步支撐多源數(shù)據(jù)的融合分析,需要匹配建模數(shù)據(jù)的獲取或統(tǒng)計的空間形式。本文主要以柵格類數(shù)據(jù)的分辨率匹配、融合及傳感器類數(shù)據(jù)生產(chǎn)方式為例說明基于建模數(shù)據(jù)劃分空間單元的方法。
柵格數(shù)據(jù)是城市人口分布估計最常見的研究數(shù)據(jù),為了匹配柵格數(shù)據(jù)的分辨率,文獻[43]使用由規(guī)則多邊形構(gòu)成的地理格網(wǎng)作為空間單元(圖2(b))。文獻[44]采用1 km格網(wǎng)來分析自然與社會現(xiàn)象,進而格網(wǎng)的概念發(fā)展成為一種地學(xué)分析方法。隨著多個全球人口數(shù)據(jù)項目的建立,如GPW、LandScan等都推動了基于格網(wǎng)單元人口分布與分析的發(fā)展[45-46],通過控制格網(wǎng)尺寸的大小可以實現(xiàn)對不同空間分辨率柵格數(shù)據(jù)的有效匹配和人口分布數(shù)據(jù)的展現(xiàn)。文獻[47—48]利用不同分辨率的夜間燈光數(shù)據(jù)基于地理格網(wǎng)研究人口分布特征,具有相似特征的柵格數(shù)據(jù)還包括遙感光譜數(shù)據(jù)[49]、土地利用數(shù)據(jù)[50]和地理形態(tài)數(shù)據(jù)[51-53]等。進一步地,由于規(guī)則劃分的特點,地理格網(wǎng)不僅可以直接匹配上述的研究數(shù)據(jù),也為單元內(nèi)其他類型信息的快速統(tǒng)計和多源數(shù)據(jù)融合,以及開展人口分布估計提供了支撐[54]。例如為了多種遙感柵格數(shù)據(jù)的特征疊加,文獻[55—56]基于地理格網(wǎng)融合了多種遙感數(shù)據(jù)。文獻[57—58]基于地理格網(wǎng)結(jié)合遙感數(shù)據(jù)與GIS數(shù)據(jù)的特征進行了建模。文獻[59—60]為了多源數(shù)據(jù)的快速統(tǒng)計減少計算量,基于地理格網(wǎng)綜合統(tǒng)計了GIS數(shù)據(jù)和帶有人口時空信息的眾源大數(shù)據(jù)。隨著新型傳感器的發(fā)展,出現(xiàn)了多種具有人口時空信息的個體時空標(biāo)記數(shù)據(jù),受限于部分類型數(shù)據(jù)的記錄方式,為了科學(xué)地開展人口分布估計,相關(guān)研究基于數(shù)據(jù)獲取特點結(jié)合數(shù)學(xué)理論劃分空間單元(圖2(c))。文獻[61]根據(jù)手機信令數(shù)據(jù)的獲取方式,以手機基站位置為中心建立Voronoi多邊形表示基站的服務(wù)范圍,用于分析估計葡萄牙里斯本的人口分布。文獻[62]根據(jù)地鐵智能卡數(shù)據(jù)的記錄方式,以173個地鐵站點構(gòu)建泰森多邊形標(biāo)識地鐵服務(wù)范圍,分析了北京市人口分布動態(tài)變化情況。文獻[63]為了綜合統(tǒng)計3個手機運營商的手機信令數(shù)據(jù),以3個運營商的手機基站為核心結(jié)合Delaunay三角形劃分方法構(gòu)建統(tǒng)計分析子單元分別表示不同基站的服務(wù)范圍,進而分析了城市人口的動態(tài)分布情況。
圖2 基于應(yīng)用場景屬性需求和數(shù)據(jù)形式的單元劃分示例Fig.2 Examples of unit construction based on application scenarios and data requirements
總體而言,上述劃分方法主要從研究數(shù)據(jù)出發(fā),根據(jù)數(shù)據(jù)的時空尺度和統(tǒng)計方式,充分提取了研究數(shù)據(jù)的時空和屬性特征,并推動了數(shù)據(jù)間的融合,有效提高了人口分布估計的時空分辨率和準(zhǔn)確度。但是,這些單元由研究數(shù)據(jù)驅(qū)動劃分的同時也受到研究數(shù)據(jù)本身的限制,其空間分辨率和構(gòu)建過程對于數(shù)據(jù)有較強的依賴性,對于數(shù)據(jù)的完整度和獲取都提出了較高的要求。
模型與方法是城市人口時空分布估計研究中的核心內(nèi)容,相關(guān)研究者從不同角度對城市人口分布估計的模型和方法做了總結(jié)。文獻[10]綜合了GIS和遙感文獻中關(guān)于人口估計的方法,將其分為區(qū)域插值和統(tǒng)計建模2類。文獻[9]對國內(nèi)外網(wǎng)格化的人口分布估計模型進行了總結(jié),將其分為面積權(quán)重模型、核心估計模型、土地利用影響模型、重力模型和多源數(shù)據(jù)融合模型5類。文獻[12]基于人口數(shù)據(jù)空間化方法的基本原理,將其歸納為城市地理學(xué)中的人口密度模型、空間插值方法和基于遙感和GIS的統(tǒng)計建模方法3類。本文主要從人口時空分布估計的對象出發(fā),將其分為靜態(tài)人口和動態(tài)人口兩個類別,針對兩種估計對象分別開展方法和模型的詳細(xì)闡述。
靜態(tài)人口是對某一個時間節(jié)點上人口狀況的總稱,通過截取某一個時間節(jié)點的人口靜止?fàn)顩r,反映連續(xù)不斷變動過程中城市某一區(qū)域人口的快照。靜態(tài)人口統(tǒng)計的內(nèi)容,包括一定時間區(qū)間上的人口總數(shù)、人口密度和人口的地區(qū)分布。為了更準(zhǔn)確地敘述模型與方法,本文將靜態(tài)人口定義為某個區(qū)域內(nèi)的人口普查工作中的常住人口。因此,針對靜態(tài)人口分布估計,主要分為傳統(tǒng)人口密度模型、空間插值和統(tǒng)計回歸3種方法。
2.1.1 傳統(tǒng)人口密度模型
20世紀(jì)50年代以來,城市人口分布估計的研究吸引了大量學(xué)者的關(guān)注,研究者從地理學(xué)和經(jīng)濟學(xué)的角度出發(fā),形成了一系列描述城市人口分布的人口密度模型。最早的城市人口密度模型利用數(shù)據(jù)學(xué)模型進行表達[64],其核心思想是人口與城市中心的距離關(guān)系為由中心向外圍呈遞減關(guān)系,Clark模型的表達式為
d(x)=M×e-λx
式中,M為常數(shù),是城市中心的人口密度;x為該位置城市中心的距離;e為自然常數(shù);λ為人口密度衰減的定量系數(shù),高值表示人口密度衰減快,低值表示人口密度衰減慢;d(x)為x位置的人口密度?;贑lark模型的研究成果,相關(guān)研究者對城市人口分布描述的模型做出了進一步的探索和改進,典型的模型例如異速生長模型、正態(tài)密度模型、Smeed模型、Newling模型、Gamma模型和分形模型等[65-70]。
傳統(tǒng)的城市人口密度模型使用簡單,能夠快速地對城市人口分布進行宏觀或大尺度的描述。但是,這些模型是對城市人口密度的理想近似模型[7],只考慮了城市中心對于人口分布的影響而忽略了自然、經(jīng)濟和人為調(diào)控等因素的內(nèi)在作用。因此,這些模型對于目前的城市人口分布估計具有一定參考價值,其估計精度和空間尺度應(yīng)用范圍不能滿足精細(xì)化的人口管理需求,目前很少有研究者采用該模型進行研究。
2.1.2 空間插值方法
政府人口普查數(shù)據(jù)由于匯總方式和隱私問題,在空間上一般以行政單元的方式展示,并且只到區(qū)縣、街道一級。為了獲得空間上更為精細(xì)的人口分布數(shù)據(jù),部分研究者利用空間插值的方法將人口普查數(shù)據(jù)根據(jù)一定權(quán)重值在更精細(xì)的空間單元上進行分配。
空間插值理論假設(shè)在空間上鄰近的點具有相似的特征值,根據(jù)空間插值在人口分布估計中的應(yīng)用范式,可將其分為面插值[71]、點插值和地統(tǒng)計學(xué)3類[12]。面插值即一種面狀單元到另一種面狀單元的轉(zhuǎn)換[72],其中以面積權(quán)重法為最基本的方法。文獻[73]在傳統(tǒng)面積權(quán)重法的基礎(chǔ)上提出了對真實人口分布估計的面積內(nèi)插方法。文獻[74]基于面積權(quán)重的方法估計了賓夕法尼亞州東南地區(qū)100 m格網(wǎng)的人口分布。點插值是采用一定的采樣點代替面從而進行插值,核密度函數(shù)是人口數(shù)據(jù)點插值最常用的方法[73],典型研究如文獻[75]利用核心估計方法將人口密度分配到1 km格網(wǎng)上。地統(tǒng)計學(xué)以區(qū)域化變量理論為基礎(chǔ),研究分布于空間中并顯示出一定結(jié)構(gòu)性和隨機性的現(xiàn)象。文獻[76]利用變量理論以沈陽市為例,證明了人口密度尺度效應(yīng)的存在。文獻[77—78]利用克里金法進行了基于格網(wǎng)的地統(tǒng)計插值,分別估計了30、300 m格網(wǎng)分辨率的人口分布數(shù)據(jù)。
基于空間插值的方法理論成熟,可以將傳統(tǒng)人口普查數(shù)據(jù)科學(xué)地分配到更精細(xì)的分析單元上。但是,其中面插值的理論基礎(chǔ)是行政區(qū)劃內(nèi)的人口是均勻分布的,點插值則是用點要素來表征人口密度,這些特點導(dǎo)致這兩類方法適合幾十千米級的大尺度人口估計,而在更精細(xì)的尺度則需要其他輔助數(shù)據(jù)進行修正。而地統(tǒng)計學(xué)方法則主要將人口分布信息分解為穩(wěn)定量和殘差量兩個部分,其中殘差量可以結(jié)合多種高分辨率遙感數(shù)據(jù)得到更精細(xì)的結(jié)果,但缺點在于模型計算復(fù)雜,實現(xiàn)難度較大。另外,空間插值方法的關(guān)鍵在于人口普查數(shù)據(jù)的準(zhǔn)確性,這使得空間插值的方法在人口普查工作統(tǒng)計效果較差的區(qū)域,如城市偏遠(yuǎn)地區(qū)或者非洲等地區(qū)的國家難以適用[79]。同時,由于人口普查數(shù)據(jù)的低頻更新特點,空間插值的方法也難以用于高頻的動態(tài)人口估計。
2.1.3 統(tǒng)計回歸方法
回歸分析指的是確定兩種或兩種以上變量間相互依賴的定量關(guān)系的一種統(tǒng)計分析方法。隨著遙感和GIS技術(shù)的發(fā)展,多種類型地理大數(shù)據(jù)的獲取為城市人口時空分布估計提供了新的信息來源。統(tǒng)計回歸方法則可以構(gòu)建多源地理大數(shù)據(jù)和靜態(tài)人口分布之間的定量關(guān)系模型,是一種自下而上的估計思想,且不需要輸入人口普查數(shù)據(jù)。根據(jù)數(shù)據(jù)類型的不同,部分研究者對統(tǒng)計回歸方法的研究方向進行了初步總結(jié)。文獻[6]在研究中將其分為遙感光譜與人口的關(guān)系、遙感和GIS間接構(gòu)建人口指標(biāo)及通過遙感影像獲取土地利用數(shù)據(jù)3類研究方向。文獻[12]將其分為土地利用類型法、基于像元特征法和多源信息融合法3類。綜合相關(guān)研究成果,本文將統(tǒng)計回歸方法歸納為基于遙感圖像像元特征、基于遙感和GIS數(shù)據(jù)特征融合2類。
基于遙感圖像像元特征的回歸方法期望建立人口分布與遙感圖像像元特征的關(guān)系模型,常見的特征量包括波譜、紋理、夜間燈光。文獻[80]使用遙感圖像的像元結(jié)合多元回歸方法建立了人口分布估計的模型,并在日本關(guān)東和東京市進行了500 m格網(wǎng)的人口分布估計。文獻[81]研究了TM影像中不同波段的光譜值與城市人口密度之間的關(guān)系并利用Spot影像對香港基于行政區(qū)劃TPU單元進行了人口分布的估計[82]。文獻[83]在波譜值的基礎(chǔ)上引入紋理信息共同估計人口分布。文獻[47,84—85]引入了美國的國防氣象衛(wèi)星計劃數(shù)據(jù),研究表明燈光強度、燈光等級、燈光區(qū)面積等屬性與人口分布存在較高的相關(guān)性。除了直接利用遙感數(shù)據(jù)像元特征估計人口分布以外,相關(guān)研究者從遙感圖像中進一步提取與城市人口分布相關(guān)的信息對城市人口分布進行研究。文獻[86]根據(jù)遙感影像上解譯的建筑物數(shù)量對人口普查數(shù)據(jù)的精度進行了驗證和比較。另一種常見的從遙感數(shù)據(jù)中提取的信息是土地利用數(shù)據(jù),相關(guān)研究表明人口與土地利用類型尤其是居住地最為密切。文獻[87]利用遙感影像獲取土地利用數(shù)據(jù)繪制了英國萊斯特郡1×1 km格網(wǎng)的人口分布數(shù)據(jù)。文獻[88]建立了土地利用類型與人口數(shù)量的回歸模型并對中國多個城市進行了1×1 km的人口分布估計。然而,由于不同地區(qū)獲取的遙感圖像數(shù)據(jù)在難易程度、數(shù)據(jù)質(zhì)量和空間分辨率上具有較大差異,導(dǎo)致僅輸入遙感圖像特征的模型遷移性較弱。
為了解決上述問題,相關(guān)研究者進一步引入多種類型城市地理要素作為影響因子構(gòu)造多源數(shù)據(jù)特征融合的回歸模型。文獻[46]基于全球人口數(shù)據(jù)集Landscan結(jié)合夜間遙感、土地利用數(shù)據(jù)、人口普查、DEM和道路網(wǎng)等數(shù)據(jù)建立了1×1 km網(wǎng)格的人口分布數(shù)據(jù)。文獻[51]分析了與人口分布相關(guān)的GIS因子,如土地利用、高程帶、坡度帶、坡向帶等。文獻[89]基于遙感影像、土地覆蓋和DEM等數(shù)據(jù)結(jié)合決策樹建立空間單元的權(quán)重估計了城市100×100 m的人口分布。文獻[56]基于遙感和多種GIS數(shù)據(jù)采用單個空間單元內(nèi)影響因子貢獻比重的方法,構(gòu)建了回歸估計模型,有效提高了估計的精度。近年來,城市興趣點(POI)是靜態(tài)人口分布估計中最流行的建模數(shù)據(jù),由于其類型多、數(shù)量大,以及與靜態(tài)人口分布關(guān)系密切的特點,眾多研究者增加POI數(shù)據(jù)建立了更準(zhǔn)確、精細(xì)化程度更高的回歸模型[90-95]。文獻[96—97]引入了建筑物數(shù)據(jù),利用建筑物與靜態(tài)人口的強相關(guān)關(guān)系修正估計結(jié)果,提高了估計精度。進一步,隨著深度學(xué)習(xí)技術(shù)的發(fā)展,文獻[98—99]將高分辨率夜間燈光、土地利用和地形等遙感數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練,得到大范圍的高精度人口分布估計結(jié)果,在人口數(shù)量稀疏地區(qū)具有良好的精度。
高分辨率遙感影像城市人口分布估計模型的建模方法較為簡單且估計精度較高并且隨著近年來的遙感數(shù)據(jù)獲取方式和類型增多,該方法具有很好的空間覆蓋性和穩(wěn)健性。而基于遙感和GIS數(shù)據(jù)特征融合的回歸方法考慮了多種因素對于人口分布的影響,可以科學(xué)地為多個影響因子分配權(quán)重,較大程度地提高了城市人口分布估計的精度,空間分辨率可以達到幾十米格網(wǎng)甚至建筑物級[5]。同時,該方法擁有良好的可擴展性,易與不同的GIS數(shù)據(jù)結(jié)合,是目前城市靜態(tài)人口時空分布估計的最常用的方法。但是,隨著建模要素的增加,該方法缺少數(shù)據(jù)間的相關(guān)性分析,各因子權(quán)重的確定與模型計算較為復(fù)雜并增加了信息冗余,同時也影響了對人口分布估計結(jié)果的可解釋性。因此,上述方法中涉及的數(shù)據(jù),如遙感數(shù)據(jù)、道路數(shù)據(jù)和POI數(shù)據(jù)的更新頻率較低,一般以年為單位,在對高時間分辨率下的城市人口進行估計時較難利用其數(shù)據(jù)特征。
與靜態(tài)人口的定義相對,動態(tài)人口指的是在多個時間點上的人口狀況總稱。通過截取一段時間區(qū)間,以不同時間粒度反映城市某一區(qū)域人口的連續(xù)變化過程,即動態(tài)人口的狀況是隨時間不斷改變的。由于動態(tài)人口分布變化的隨機性和復(fù)雜性[100],并且缺少權(quán)威的動態(tài)人口分布數(shù)據(jù),目前的研究方法主要圍繞數(shù)據(jù)展開,實際上研究的是不同時間粒度下的人口活動量和相關(guān)特征。本文針對主要研究數(shù)據(jù)類型將相關(guān)方法分為基于土地利用類型、基于帶有個體時空標(biāo)記的數(shù)據(jù)和其他動態(tài)估計方法3類。
2.2.1 基于人口普查和土地利用分類數(shù)據(jù)的估計方法
遙感和GIS數(shù)據(jù)由于數(shù)據(jù)獲取頻率較低,一般為某一時刻下的靜態(tài)值,不能直接適用于動態(tài)人口分布估計,但是部分研究者以人口普查數(shù)據(jù)和土地利用類型數(shù)據(jù)在不同時刻存在人口數(shù)量的規(guī)律為基礎(chǔ),建立了土地利用-時間-人口數(shù)量的關(guān)系模型,從而對城市人口分布進行粗粒度的動態(tài)估計。文獻[101]以重慶市北碚區(qū)為試驗區(qū)域,從Google Earth影像中解譯結(jié)合實地調(diào)研獲取北碚區(qū)13種土地利用類型,同時引入土地利用類型吸引權(quán)重,根據(jù)居民上班、休息等出行行為,結(jié)合白天、夜晚兩個典型時間特征構(gòu)建7個時間段并將人口普查數(shù)據(jù)按權(quán)重進行分配。文獻[102]根據(jù)城市人口活動規(guī)律將人口分為家庭人口、鐘擺人口和隨機人口3類,并建立了這3類人口與土地利用類型和時間的關(guān)系模型,進而利用不同土地利用類型的面積權(quán)重結(jié)合人口普查數(shù)據(jù)分配得到了北京市海淀區(qū)250 m格網(wǎng)下的晝夜人口分布情況。文獻[103]采用相似的方法并進一步結(jié)合建筑物功能、樓層數(shù)和面積等信息估計了南京市秦淮區(qū)100 m格網(wǎng)的晝夜人口分布情況。
基于土地利用類型的方法初步實現(xiàn)了一天不同時間段內(nèi)城市人口分布的估計,并以白天和夜晚兩個主要時間段進行區(qū)分,同時通過土地利用數(shù)據(jù)并結(jié)合其分類語義描述的建模方法對人口活動模式具有較好可解釋性和空間范圍覆蓋性,與人口統(tǒng)計數(shù)據(jù)的結(jié)合能夠反映人口分布數(shù)量的空間特征。但是,由于對人口出行規(guī)律認(rèn)識不足、人口行為隨機性和土地利用類型劃分不精細(xì)等問題,這類方法的研究結(jié)果時間分辨率較低,通常只能達到晝夜的粗粒度估計,對于晝夜時間段中更精細(xì)的人口活動表達和挖掘能力較低。
2.2.2 基于個體時空標(biāo)記數(shù)據(jù)的估計方法
隨著傳感器、無線通信技術(shù)和網(wǎng)絡(luò)技術(shù)的發(fā)展,移動電話、智能卡、GPS等泛在傳感器被大量普及[104-105],產(chǎn)生了大量內(nèi)容豐富、屬性詳細(xì)和細(xì)粒度的新型數(shù)據(jù),這些數(shù)據(jù)大都帶有個體粒度的時空標(biāo)記,為長時間、高精度、高效地跟蹤個體空間移動提供了可能性[106-109]。因此,大量人類時空研究開始基于如GPS數(shù)據(jù)、智能卡數(shù)據(jù)、社交媒體數(shù)據(jù)和手機數(shù)據(jù)等進行開展[110-113],這也推動了城市人口時空分布估計的方法從“計量假設(shè)”到“實際行為”的轉(zhuǎn)變,為城市人口分布研究提供了新的研究范式[114]。本文根據(jù)近年來的研究成果中數(shù)據(jù)的類型、用戶群體和時空間粒度等特點的不同,將其歸納為基于智能卡刷卡數(shù)據(jù)、基于社交媒體數(shù)據(jù)和基于手機數(shù)據(jù)3類方法。
(1) 基于智能卡刷卡數(shù)據(jù)的估計方法。隨著現(xiàn)代城市的發(fā)展,城市公共交通體系的建設(shè)也逐漸完善,在方便城市人口出行改善城市交通狀況的同時也儲存了大量由智能卡產(chǎn)生的刷卡記錄數(shù)據(jù),例如公交車、城市地鐵等[115-116]。這些記錄中通常包含精細(xì)的時間和空間信息[117],結(jié)合廣泛分布的公共交通站點,可以為動態(tài)人口時空分布估計提供新的研究思路。文獻[28]基于北京市公交車站點數(shù)據(jù),結(jié)合公交車刷卡記錄估計了北京市人口在早晚就業(yè)通勤和家庭活動時刻的位置分布進而識別了持卡人的居住地、就業(yè)地。文獻[62]基于北京市173個地鐵站的刷卡進出數(shù)據(jù)構(gòu)建了以北京社區(qū)為空間單元的小時級粒度人口分布估計模型,并基于夜晚休息、早通勤、白天工作、晚通勤和晚間活動等多個典型時間段進行了研究。文獻[118]基于上海市289個地鐵站點,基于一周的地鐵刷卡數(shù)據(jù)識別單元內(nèi)通勤、工作和休閑時間段的人口數(shù)量,通過面積權(quán)重將人口數(shù)分配到街道級別。
基于智能卡刷卡數(shù)據(jù)的估計方法具有較為連續(xù)的時間分辨率,相比土地利用數(shù)據(jù),可以估計一天內(nèi)任意時刻的人口活動情況,并且對人口的通勤空間分布特征有較好的反映。但是,智能卡刷卡記錄只能反映人口的行為片段,該方法在城市人口出行高峰的時間段精度和采樣頻率較高,對于沒有出行行為人口或出行活動較少的時間段無法很好地表征。目前的研究一般以某一種公共交通數(shù)據(jù)為研究對象,以此來研究人口活動具有一定的局限性,隨著智能卡功能的升級和公共交通體系的統(tǒng)一,在未來其數(shù)據(jù)仍然有很大的研究價值。
(2) 基于社交媒體數(shù)據(jù)的估計方法。網(wǎng)絡(luò)信息技術(shù)和智能感知設(shè)備的發(fā)展提供了各類豐富的應(yīng)用軟件,改變了人們的生活行為方式,這其中有越來越多的應(yīng)用軟件使用基于位置的服務(wù)(LBS)技術(shù)或由于用戶記錄從而提供大量關(guān)于個人的時空信息[119],社交媒體就是其中的典型應(yīng)用[120]。在使用社交媒體的功能中會產(chǎn)生定位信息,如社交媒體的簽到功能可以直接捕捉人口的活動位置[121];社交媒體用戶發(fā)布的消息和內(nèi)容也包含著用戶的時間和空間信息,從而形成用戶的時空分布軌跡。例如Twitter、Flickr的推文[122-123],因此這就為動態(tài)人口分布估計提供了新的數(shù)據(jù)源。文獻[124]分析得出Twitter的推文可以提供小于10 m空間分辨率的大量人口樣本。文獻[125]基于新浪微博簽到數(shù)據(jù)結(jié)合聚類算法將南京市劃分為90個空間子單元,并將一天24 h根據(jù)休息、工作、通勤、休閑活動分為8個典型時間段進行人口分布特征研究。文獻[13]基于Twitter的地理推文數(shù)據(jù)將印度尼西亞雅加達地區(qū)3級行政區(qū)域的人口分布數(shù)據(jù)映射到4級行政區(qū)域,結(jié)果表明地理推文數(shù)據(jù)有效提高了人口分布估計的精度。文獻[79]提出社交媒體數(shù)據(jù)不僅可以作為傳統(tǒng)人口分布估計的一種協(xié)變量,也可以單獨作為數(shù)據(jù)源估計動態(tài)的人口分布情況。
基于社交媒體數(shù)據(jù)的方法具有米級空間分辨率和小時級時間分辨率,數(shù)據(jù)中包含的用戶信息可以持續(xù)地對大量人口在時間和空間上進行直接映射。相較于智能卡刷卡數(shù)據(jù),該類數(shù)據(jù)在連續(xù)單位時間上的用戶采樣更為均勻,避免了不同時間段內(nèi)的數(shù)據(jù)稀疏性,并且對夜晚休閑時間的活動人口特征進行了較好表達。但是,社交媒體數(shù)據(jù)具有明顯的采樣偏差問題,其用戶主要反映的是城市人口中的年輕人群的活動特征,從而導(dǎo)致在空間上存在較多的零分布單元或稀疏單元即數(shù)據(jù)盲區(qū),進而對研究結(jié)果產(chǎn)生誤差;同時社交媒體數(shù)據(jù)的數(shù)據(jù)量較大,錯誤數(shù)據(jù)、無效數(shù)據(jù)和重復(fù)數(shù)據(jù)較多,數(shù)據(jù)預(yù)處理工作較為復(fù)雜。目前社交媒體數(shù)據(jù)一般作為參考數(shù)據(jù)或協(xié)變量應(yīng)用于城市人口時空分布估計,由于其數(shù)據(jù)記錄詳細(xì)、時空信息準(zhǔn)確等特點,一直是相關(guān)研究關(guān)注的熱點。
(3) 基于手機數(shù)據(jù)的估計方法。智能手機作為現(xiàn)代化的通信設(shè)備已經(jīng)在社會上廣泛普及[126],手機的通信行為、應(yīng)用行為和管理行為產(chǎn)生了大量帶有手機用戶時空特征的信息,例如信令數(shù)據(jù)、通話記錄數(shù)據(jù)等,這些數(shù)據(jù)由手機網(wǎng)絡(luò)運營商收集且成本低廉[127],因此已經(jīng)有眾多學(xué)者利用手機數(shù)據(jù)對城市人口的時空活動進行了跟蹤、分析和研究[128-132]。
基于手機數(shù)據(jù)的特點和研究成果,近十年來使用手機數(shù)據(jù)對動態(tài)人口時空分布進行估計已經(jīng)成為國內(nèi)外研究的熱點。針對手機通話記錄數(shù)據(jù),文獻[133]利用每個移動基站的話務(wù)量數(shù)據(jù)建立了深圳市1 km格網(wǎng)每小時的人口分布估計模型。文獻[134]分析了手機呼叫數(shù)量數(shù)據(jù)與人口數(shù)量之間的相關(guān)關(guān)系,并用Landscan數(shù)據(jù)集進行了驗證。文獻[61]將手機呼叫記錄數(shù)據(jù)及里斯本的人口普查數(shù)據(jù)映射到100 m格網(wǎng),并分析了手機數(shù)據(jù)在動態(tài)人口分布估計上的可能性。文獻[59]基于手機呼叫數(shù)據(jù)結(jié)合人口出行調(diào)查數(shù)據(jù),利用多元回歸模型建立了日本多個城市500 m格網(wǎng)每30 min的人口分布估計模型。針對手機信令數(shù)據(jù),文獻[63]綜合了3個手機運營商的手機信令數(shù)據(jù),以3個運營商的基站服務(wù)范圍為基礎(chǔ)建立人口分析子單元,并利用POI數(shù)據(jù)將不同時刻的基站通信用戶數(shù)量分配到子單元中估計人口分布的情況,同Worldpop數(shù)據(jù)集的驗證結(jié)果表明其估計精度要高于其他模型。文獻[135—136]基于手機信令數(shù)據(jù)以基站服務(wù)范圍為空間單元,利用數(shù)據(jù)反演的方法估計了上海市每30 min的人口分布情況,并將結(jié)果分別映射到1 km和500 m的格網(wǎng)中。在此基礎(chǔ)上,文獻[137—140]結(jié)合GIS數(shù)據(jù)通過插值方法來彌補空間精度不足的問題。
基于手機數(shù)據(jù)的估計方法具有估計精度高、模型易操作和時間分辨率高等優(yōu)勢。相比其他新型數(shù)據(jù),由于其用戶覆蓋群體范圍較大且不存在群體偏差,因此對于任意一天內(nèi)任意時刻,典型的人口活動時間段都具有較準(zhǔn)確的特征表達。但是,該方法在空間分辨率上直接受手機基站的密集程度的影響,在基站布設(shè)稀疏的城市就限制了其研究結(jié)果的應(yīng)用范圍,并且不同手機運營商的市場占比不同,不能直接與真實的人口分布特征相關(guān)聯(lián);同時以基站為質(zhì)心建立數(shù)學(xué)多邊形作為空間單元偏離了城市人口的實際聚合方式,從而會導(dǎo)致對城市人口時空特征認(rèn)知的偏差[60],其結(jié)果展示一般需要做插值或數(shù)據(jù)映射。
2.2.3 其他動態(tài)估計方法
除了上述估計方法以外,相關(guān)學(xué)者也采用了其他方法對動態(tài)人口分布進行研究。文獻[141]基于遺傳算法模型結(jié)合地形地貌、交通設(shè)施、土地覆蓋等GIS因子對山西省和順縣1 km格網(wǎng)的人口分布進行了動態(tài)模擬。文獻[142]根據(jù)耗散結(jié)構(gòu)理論自組織建模原理,在費爾哈斯模型基礎(chǔ)上以城市區(qū)域人口為狀態(tài)變量模擬了廣州市人口分布。同時,部分研究者基于智能體模擬方法以家庭或個體為人口估計單位隨機生成人口分布數(shù)據(jù),根據(jù)輔助GIS數(shù)據(jù)或社會經(jīng)濟數(shù)據(jù)對單位人口進行遷移模擬,經(jīng)過迭代達到穩(wěn)定狀態(tài)即為城市人口分布的估計結(jié)果[2,143]。另外,高分辨率的遙感數(shù)據(jù)對于大范圍的動態(tài)人口分布的研究提供了進一步的支持。文獻[144]以隨機森林模型為基礎(chǔ)結(jié)合夜間燈光遙感數(shù)據(jù)、建筑物數(shù)據(jù)及人口活動模式設(shè)計了小時級人口分布估計的框架。文獻[145]利用城市內(nèi)不同功能、地形和地貌的遙感圖像和LBS軌跡數(shù)據(jù)輸入卷積神經(jīng)網(wǎng)絡(luò)模型進行訓(xùn)練,進而研究分析了多個城市的日常人口活動特征,尤其在傳感器數(shù)據(jù)難以獲取的稀疏地區(qū)具有更好的應(yīng)用效果。上述方法中以智能體為代表的模擬模型隨著模擬單位數(shù)量和影響因子的增加,計算量急劇增加,很難得到準(zhǔn)確模擬結(jié)果[3]。而基于高分辨率遙感數(shù)據(jù)的研究由于數(shù)據(jù)精度高、易獲取和覆蓋范圍廣的特點,其空間分辨率較高且空間均質(zhì)性較好,具有較好的方法普適性和遷移性。然而上述方法多基于更新頻率較低的數(shù)據(jù),因此在時間分辨率上還有待進一步精細(xì)化。
綜上所述,目前的人口時空分布估計方法針對估計對象可以分為靜態(tài)人口分布估計和動態(tài)人口分布估計2個方向(表1)。其中,靜態(tài)人口分布估計方法經(jīng)過長期發(fā)展,研究成果已較為豐富。以空間插值和統(tǒng)計回歸為代表,其估計結(jié)果的空間精度可達到幾十米級粒度,進一步可以達到建筑物粒度,建模的數(shù)據(jù)和特征也相對成熟。而對于動態(tài)人口分布估計,由于城市人口動態(tài)變化的復(fù)雜性,無法得到真實的高頻人口分布,目前的研究還主要依賴于新型的個體時空標(biāo)記數(shù)據(jù)作直接統(tǒng)計和簡單特征提取,并對不同時刻和典型時間段的人口活動特征進行合理估算,估計結(jié)果取決于數(shù)據(jù)質(zhì)量,時空分辨率不穩(wěn)定。
表1 不同模型與方法特點Tab.1 Characteristics of different models and methods
城市人口的研究與城市發(fā)展有著本質(zhì)上的聯(lián)系,這是因為城市的發(fā)展實質(zhì)上就是人的發(fā)展,人口為城市的繁榮發(fā)展提供推動力,反之,城市的良好發(fā)展也會提高人口生活質(zhì)量和幸福指數(shù),二者緊密關(guān)聯(lián),互相促進。相較于城市經(jīng)濟、文化的研究,對城市人口的研究具有更重要的意義,其中城市人口分布具有重要的參考價值。目前,城市人口時空分布估計的研究成果已經(jīng)在城市發(fā)展管理中得到了一定的應(yīng)用。
城市的空間規(guī)劃是城市建設(shè)和管理的基礎(chǔ)內(nèi)容,其具體的表現(xiàn)就是城市的空間結(jié)構(gòu)??臻g結(jié)構(gòu)是城市發(fā)展的宏觀體現(xiàn),是人口發(fā)展、政策規(guī)劃、自然環(huán)境等因素共同作用下人類空間活動和區(qū)位選擇的積累結(jié)果[146-147],對城市空間結(jié)構(gòu)的分析既是對已有城市空間規(guī)劃的驗證也是對未來規(guī)劃的重要參考,例如城市空間結(jié)構(gòu)中的中心區(qū)域、功能區(qū)域和熱點區(qū)域都是政府管理和規(guī)劃的聚焦點[148-149]。傳統(tǒng)方法在解決這些問題的時候一般采用調(diào)研、政策統(tǒng)計、經(jīng)濟文化數(shù)據(jù)推測和人為經(jīng)驗等方法,這些方法具有“局部局限性”和“理論化”等問題,而通過城市人口時空分布估計的結(jié)果可以更直接和客觀地反映出城市空間結(jié)構(gòu)的實際情況。文獻[78]利用空間插值結(jié)合DEM數(shù)據(jù)方法識別了沈陽市的人口分布情況,其結(jié)果表明沈陽市發(fā)展不符合單中心范式,具有11個明顯的人口分布核心,城市空間結(jié)構(gòu)上具有多中心特征。文獻[150—151]分別利用社交媒體數(shù)據(jù)和移動手機數(shù)據(jù)進一步識別了城市的多中心結(jié)構(gòu)。文獻[152]利用英國某電信廠商的通話定位數(shù)據(jù)分析了幾十億條人口交易記錄的分布,從考慮地理區(qū)域和居民聯(lián)系強的角度上提出了一種細(xì)粒度的城市區(qū)域劃分方法。文獻[125]利用新浪微博的簽到數(shù)據(jù)研究了南京市人口在不同時間的分布位置,并將南京市人口活動區(qū)劃分為就業(yè)活動區(qū)、居住活動區(qū)、休閑活動區(qū)、夜生活活動區(qū)和綜合活動區(qū)5類。文獻[153]利用手機數(shù)據(jù)區(qū)別了上海市用戶的日間駐留地和夜間駐留地,其結(jié)果表明上海市的空間結(jié)構(gòu)在中心城區(qū)和郊區(qū)之間還存在一個中心城通勤區(qū),中心城通勤區(qū)以內(nèi)和以外區(qū)域存在顯著差異。文獻[154]利用空間句法和百度LBS大數(shù)據(jù)比較了合肥市城區(qū)理論規(guī)劃的人口密集區(qū)域和實際情況的差異,結(jié)果表明由于交通可達性、人口生活習(xí)慣等問題,理論上的人口密集區(qū)域存在與實際密集區(qū)不符的情況。
城市的基礎(chǔ)設(shè)施和交通系統(tǒng)一直是城市研究和管理人員關(guān)注的重點之一,通過分析人口在城市內(nèi)的行為軌跡、活動強度和行為特征,能夠揭示城市人口的活動演化規(guī)律及城市地理現(xiàn)象[105],可以為城市交通資源優(yōu)化、基礎(chǔ)設(shè)施配置提供支持,而動態(tài)的人口分布數(shù)據(jù)可以很好地提供人口在時空中的實際變化情況。
文獻[40]利用GPS和活動日志結(jié)合的方法對北京市郊區(qū)巨型社區(qū)的人口動態(tài)分布進行了研究,結(jié)果顯示郊區(qū)社區(qū)人口的個體活動在工作日和休息日有較大差別,總體上對市區(qū)空間的依賴性較大,顯示出郊區(qū)配套設(shè)施不完善、休閑和商業(yè)中心缺乏等問題。文獻[34]基于手機數(shù)據(jù)定量分析了肯尼亞居民到達公共健康設(shè)施的次數(shù)和距離,結(jié)果顯示距離醫(yī)療設(shè)施偏遠(yuǎn)的居民到醫(yī)院出行頻率明顯增加,因為這些居民普遍缺少流行病疫苗的接種,表明肯尼亞的公共健康設(shè)施分布不均。文獻[62]利用地鐵智能卡刷卡數(shù)據(jù)分析了北京市每小時的人口分布情況和人口出行特征,結(jié)果表明北京人口活動從夜間到白天人口呈向心流動模式,同時在晚高峰的人口估計總數(shù)低于早高峰,說明晚高峰有一部分居民在沒有時間壓力的情況下選擇了其他交通出行方式。文獻[138]利用手機信令數(shù)據(jù)分析得出上海市人口白天向中心聚集,夜間向郊區(qū)分散,就業(yè)人口較居住人口具有更顯著的中心聚集度,從而產(chǎn)生明顯的職住關(guān)系不匹配現(xiàn)象,是交通擁堵發(fā)生的重要原因。
城市的商業(yè)發(fā)展是城市經(jīng)濟的重要組成部分,通過結(jié)合城市人口的時空分布情況可以為識別商業(yè)空間格局和商業(yè)規(guī)劃調(diào)整等應(yīng)用提供信息支持。文獻[155]基于社交媒體簽到數(shù)據(jù)分析了上海市人口分布的熱點區(qū)域,同時結(jié)合百度的POI數(shù)據(jù)提出了商業(yè)店鋪選址的4個影響因素:多樣性、競爭性、相關(guān)性和客流性。文獻[156]基于百度POI和熱力圖數(shù)據(jù)分析了株洲市天元區(qū)人口空間分布和商業(yè)空間聚集情況,結(jié)果表明天元區(qū)零售業(yè)較為發(fā)達而服務(wù)業(yè)較為滯后,需要開展商業(yè)業(yè)態(tài)調(diào)整。文獻[157]以贛州市中心人口分布數(shù)據(jù)為基礎(chǔ),結(jié)合經(jīng)濟社會發(fā)展、POI數(shù)據(jù)、城市總體規(guī)劃數(shù)據(jù)對贛州市中心商業(yè)中O2O電商和實體商鋪的分布格局進行了分析和研究,進而提出了傳統(tǒng)商業(yè)轉(zhuǎn)型的一些建議。
城市人口時空分布除了上述應(yīng)用之外,還可以應(yīng)用于城市公共安全、城市環(huán)境與居民健康、城市防災(zāi)減災(zāi)等方面,為城市的綜合管理提供科學(xué)建議。文獻[158]利用移動電話數(shù)據(jù)進行實時的人口分布估計并應(yīng)用于2010年尼泊爾、海地地震后受災(zāi)人群和人口遷移的評估,結(jié)果顯示手機數(shù)據(jù)很好地反映了地震后人口時空分布的變化,尤其是加德滿都山谷人口數(shù)量明顯高于正常水平,較多人口也遷移到了尼泊爾中南部地區(qū),為災(zāi)害救援和人道主義機構(gòu)提供了及時的信息。文獻[159]以百度地圖用戶在出行之前的查詢記錄數(shù)據(jù),對城市人口分布進行了1~3 h的提前預(yù)測,并分析出可能的人口群體聚集區(qū)域,同時設(shè)置人群數(shù)量閾值進行人群災(zāi)難預(yù)警,結(jié)果表明百度地圖查詢數(shù)據(jù)與區(qū)域內(nèi)定位用戶數(shù)量之間存在強相關(guān)關(guān)系,能夠以定量方式預(yù)測群體風(fēng)險事件。文獻[15,160]通過移動電話數(shù)據(jù)獲取了動態(tài)的人口分布,同時結(jié)合基于測量站點的PM2.5的觀測值,實現(xiàn)了人口在PM2.5中暴露的實時估算,研究表明通過考慮人口分布和PM2.5的時空變異性建立一個環(huán)境污染物暴露評估的框架,有效地支持了相關(guān)環(huán)境政策的調(diào)整。
盡管對于城市人口時空分布研究的成果已經(jīng)相當(dāng)豐富,但由于城市人口分布的隨機性、復(fù)雜性和已有方法模型的局限,目前的研究還存在一些問題,這同時也是未來的研究方向。
目前,常用的空間分布單元包括行政區(qū)劃、格網(wǎng)、建筑物等,這些空間單元對人口分布刻畫的精細(xì)程度、表達效果都不盡相同,在實際應(yīng)用時可能存在精細(xì)化程度不足、空間連續(xù)性低、與城市空間形態(tài)不符等問題。需要以人口分析為核心,以應(yīng)用場景為導(dǎo)向,構(gòu)建相應(yīng)的人口分析單元。其中,場景一般具有多尺度、多類別以及動態(tài)變化的特點,然而當(dāng)前對于場景的定義模糊,場景需求認(rèn)知方法研究較少,同時還缺乏空間單元和場景變化關(guān)聯(lián)標(biāo)準(zhǔn),這些問題都導(dǎo)致單元劃分和構(gòu)建結(jié)果可能無法支撐后續(xù)的人口時空分布研究和建模。因此,需要從場景認(rèn)知角度出發(fā),研究人口分析單元的系統(tǒng)構(gòu)建方法。首先,研究城市應(yīng)用場景的具體需求認(rèn)知方法,包括時間、空間、屬性等特征,并與人口分析單元進行關(guān)聯(lián)性表達。然后,在此基礎(chǔ)上,人口時空分布估計的研究對象是城市人口,需要針對人口時空分布研究的目標(biāo)、尺度并從人口分布特征和規(guī)律角度出發(fā)考慮一種普適性空間單元的構(gòu)建,從而提高結(jié)果的科學(xué)性和解釋性。最后,可以考慮不同尺度的人口分布特征和主要影響因素,并結(jié)合場景認(rèn)知結(jié)果,研究多個空間尺度下場景關(guān)聯(lián)的單元自適應(yīng)構(gòu)建方法,有效支撐應(yīng)用的開展。綜合上述研究方向構(gòu)建人口分析單元,可以更好地挖掘人口分布規(guī)律與模式,尤其可以獲取更長效的動態(tài)人口數(shù)據(jù);同時可以契合場景需要的人口分布信息和可視化方式,支撐進一步的應(yīng)用分析。
帶有個體時空標(biāo)記的新型數(shù)據(jù)為城市人口分布估計帶來了豐富的信息和新型的研究模式,也具有難以相互融合的研究局限和使用誤區(qū)。目前的主要問題在于:①新型數(shù)據(jù)大多具有采樣偏差的問題,每種數(shù)據(jù)背后代表的人口群體數(shù)量、空間范圍都不同并且存在交叉,不能作簡單的相加處理進行融合;②時空尺度一致的數(shù)據(jù)很難收集,尤其在時間尺度上,是數(shù)據(jù)融合的關(guān)鍵;③對于新型數(shù)據(jù)和城市人口分布的關(guān)系,在方法模型上還比較匱乏,研究結(jié)果很大程度決定于數(shù)據(jù);④在大數(shù)據(jù)時代的沖擊下,部分研究者以數(shù)據(jù)決定論的方式開展研究而沒有關(guān)注人口分布背后的原因和機制。因此,未來對新型數(shù)據(jù)的研究可以從以下幾點展開:①解析不同數(shù)據(jù)的具體特點,從空間覆蓋范圍和與人口相關(guān)性高低上尋找數(shù)據(jù)融合的突破點;②解決時空尺度一致問題,考慮在時間尺度上設(shè)定標(biāo)準(zhǔn)的時間尺度作映射;③引入以AI為代表的智能的建模方法,提高模型處理多源數(shù)據(jù)的能力;④數(shù)據(jù)是服務(wù)于理論的工具,是為了證明理論的前提和假設(shè)[161],應(yīng)堅持對數(shù)據(jù)確定性的追求并從數(shù)據(jù)中挖掘有效的信息。
數(shù)據(jù)質(zhì)量一直是城市人口時空分布估計的重要基礎(chǔ),目前的研究中,存在大量數(shù)據(jù)時空間尺度不匹配、數(shù)據(jù)缺失和依賴數(shù)據(jù)質(zhì)量等問題,給數(shù)據(jù)的前期處理和建模帶來了較大的困難。此外,部分研究基于試驗地區(qū)特點,在數(shù)據(jù)和模型上做了特定處理和調(diào)整,導(dǎo)致研究結(jié)果的泛用性較差,沒有挖掘人口分布的實質(zhì)規(guī)律,不同的區(qū)域或城市很難復(fù)用其成果,例如文獻[162]利用街區(qū)的人口統(tǒng)計數(shù)據(jù)進行建筑物級的人口分布估計,而在我國公開獲得的人口統(tǒng)計數(shù)據(jù)只能到區(qū)縣一級。因此,在未來的研究中需要從人口分布關(guān)鍵特征挖掘和提高模型可解釋性的角度開展以下方向研究:①基于通用、易獲取或少量的數(shù)據(jù)進行建模,提高模型的泛用性;②從空間區(qū)域?qū)傩圆町悓θ丝诜植嫉挠绊懡嵌瘸霭l(fā),對城市進行分區(qū)建模和估計,例如,對城市空間區(qū)域按人口密度、功能、城市開發(fā)強度、離中心距離等屬性進行分區(qū),可以有效提高估計精度,并增強分布結(jié)果的可解釋性;③對人口分布從時間和空間特征上進行分解,例如在時間上可分為長期分布模式、短期分布模式和隨機分布模式,在空間上可分為全局分布概率和局部分布概率的研究,進而組成可泛用、可遷移的人口分布估計框架。
城市人口分布估計的研究需要考慮基于通用的或質(zhì)量一般的數(shù)據(jù),以挖掘人口時空分布規(guī)律和模式為目標(biāo)建立模型,從而提高模型的普適性和規(guī)律性,同時結(jié)合長期的數(shù)據(jù)獲取機制,使研究結(jié)果能夠持續(xù)獲取人口分布信息。
人口時空分布估計結(jié)果的驗證一直是研究中的重要步驟,現(xiàn)有研究主要是通過與人口統(tǒng)計數(shù)據(jù)比較或采樣驗證的方法對結(jié)果進行驗證。但是這種方法是一種粗粒度的驗證,只能對人口總數(shù)作大致的檢驗,而對于精細(xì)化程度較高的模型無法適用,尤其是對高空間分辨率和動態(tài)人口分布估計研究,由于缺少權(quán)威的數(shù)據(jù)支撐,其研究結(jié)果很難做科學(xué)驗證,從而無法對模型做有效的反饋修改。因此,除了依靠政府提供的精細(xì)化人口數(shù)據(jù)作為支撐,還需要建立估計結(jié)果的驗證機制:①參考全球的或國內(nèi)的人口分布數(shù)據(jù)集進行驗證對比,例如GPW、LandScan、Worldpop等可以提供空間和時間尺度上的公開數(shù)據(jù)集;②利用不同來源和采樣頻率的數(shù)據(jù)結(jié)合機器學(xué)習(xí)、深度學(xué)習(xí)等多種模型分別進行建模,并對結(jié)果進行相互驗證,提高結(jié)果可信度;③考慮在研究區(qū)域內(nèi)開展隨機采樣,并對區(qū)域內(nèi)人口變化進行實地調(diào)研和統(tǒng)計,對比研究的總體精度,同時驗證人口活動特征的科學(xué)性。
綜上所述,首先在空間分布單元上,分為空間尺度需求、場景需求和研究數(shù)據(jù)需求3個方向,豐富了人口分布信息展現(xiàn)的方式和效果。在城市人口分布估計的方法上,針對靜態(tài)人口,從傳統(tǒng)城市密度模型和分配人口統(tǒng)計數(shù)據(jù)的空間插值法,發(fā)展為結(jié)合多種地理大數(shù)據(jù)的統(tǒng)計回歸方法;針對動態(tài)人口,從時間粒度較粗的土地利用數(shù)據(jù)建模到基于新型個體時空標(biāo)記數(shù)據(jù)的估計方法,極大地提高了城市人口時空分布估計的精確度和時空分辨率。在未來,從構(gòu)建適應(yīng)應(yīng)用場景和表達時空分布特征的人口分析單元出發(fā),應(yīng)考慮如何融合多源異構(gòu)數(shù)據(jù)并將靜態(tài)人口建模的方法融入動態(tài)人口估計,提高模型的可解釋性和規(guī)律性并減少數(shù)據(jù)依賴,同時提供科學(xué)的驗證方法,進而獲得長效、高時空分辨率的人口分布信息。