段艷慧 郭 偉 趙學勝 張曉瑩 張冰瑞
(中國礦業(yè)大學(北京) 地球科學與測繪工程學院, 北京 100083)
人口數(shù)據(jù)是最為重要的基礎(chǔ)地理數(shù)據(jù)之一,對于國家和地區(qū)的相關(guān)情況調(diào)查、人口狀況、管理以及制定各項方針政策等都具有重要的意義,而精細化的人口分布是當前人口地理學研究的熱點和難點。人口分布分散,具有動態(tài)特征,不同的人口密度對自然資源和環(huán)境條件的影響也不同,因此,為了更好地應對我國城鎮(zhèn)化發(fā)展所面臨的各種環(huán)境與資源問題,有必要及時、快速地生成人口密度空間分布結(jié)果。傳統(tǒng)的人口密度計算方法是根據(jù)人口普查數(shù)據(jù)進行計算,但計算時間長、成本高、更新困難。此外,用于公共用途的人口普查數(shù)據(jù)難以準確、真實地反映人口在空間上的分布規(guī)律,中國的縣級人口普查數(shù)據(jù)對于城市規(guī)劃和管理等方面來說不夠細致,難以滿足城市規(guī)劃和發(fā)展的需要。
在過去的幾十年里,許多學者探究了利用不同的遙感和輔助數(shù)據(jù)估算人口的方法。這些研究多針對現(xiàn)有的土地利用數(shù)據(jù),而并非所有土地利用類型均有人口分布,例如,水體、耕地、森林等。在土地利用數(shù)據(jù)中,不透水面(impervious surface area, ISA)是城市中人類活動的主要場所,研究表明,利用ISA可以進行人口估計。同時,利用Landsat影像可以準確地估計ISA。而由于縣級尺度的人口普查數(shù)據(jù)過于粗糙,需要像元尺度的更詳細的人口密度數(shù)據(jù)。但在小尺度上進行的研究很少,在小尺度上快速而準確地估計人口密度的過程尚不為人知。目前尚缺乏繪制人口密度分布圖的合適技術(shù)或方法。因此,本文試圖通過區(qū)(縣)尺度上的人口密度與遙感影像獲取的ISA數(shù)據(jù)之間的關(guān)系來繪制30 m像元尺度上的人口密度分布圖。
本文選取北京市為研究區(qū),開展基于Landsat遙感影像的人口密度研究。北京(Beijing)位于中國華北平原北部,背靠燕山,毗鄰天津市和河北省,是中華人民共和國首都、直轄市、國家中心城市、超大城市,全國政治中心、文化中心、國際交往中心、科技創(chuàng)新中心。北京位于115.7 °~117.4 °E,39.4 °~41.6 °N。截至2020年,全市下轄16個區(qū),總面積16 410.54 km,常住人口2 189.31萬人。北京市經(jīng)濟發(fā)展水平較高,人口較為集中分布,路網(wǎng)分布密集,是城市化發(fā)展高水平的代表城市之一。
本研究采用美國陸地衛(wèi)星計劃(Landsat)的第八顆衛(wèi)星(Landsat8)、開源地圖(open street map,OSM)、可見光紅外成像輻射儀(visible infrared imaging radiometer,VIIRS)-日夜波段(day/night band,DNB)夜間燈光數(shù)據(jù)、第七次人口普查數(shù)據(jù)(含鄉(xiāng)鎮(zhèn)街道級別)、Worldpop數(shù)據(jù)以及行政邊界數(shù)據(jù)。由于使用的數(shù)據(jù)源不同,因此,首先要對所有的數(shù)據(jù)進行重投影以保持各數(shù)據(jù)之間的一致性。采用線性光譜混合分析法(linear spectral mixture analysis,LSMA)對Landsat8影像進行處理繪制北京市ISA分布。Worldpop數(shù)據(jù)作為已有人口密度數(shù)據(jù)用來對本文方法所作結(jié)果進行對比分析。
人口普查數(shù)據(jù)來自北京市第七次全國人口普查公報(第二號)(北京市統(tǒng)計局)。全市16個區(qū)中,常住人口在200萬人以上的區(qū)有4個,分別是朝陽區(qū)、海淀區(qū)、昌平區(qū)和豐臺區(qū);在100萬人~200萬人之間的區(qū)有5個,分別是大興區(qū)、通州區(qū)、順義區(qū)、房山區(qū)和西城區(qū);在100萬人以下的區(qū)有7個,分別是東城區(qū)、石景山區(qū)、密云區(qū)、平谷區(qū)、懷柔區(qū)、門頭溝區(qū)和延慶區(qū)。
利用Landsat8影像與北京市2020年人口普查數(shù)據(jù)繪制人口密度的基本流程如圖1所示。
注:①迭代自組織數(shù)據(jù)分析算法(iterative selforganizing data analysis,ISODATA)。圖1 基于Landsat8與普查數(shù)據(jù)的人口密度流程圖
為了使用LSMA方法有效地處理圖像,選擇合適的端元是至關(guān)重要的。由于影像3、4、5波段基本涵蓋所有的地類信息,所以在從Landsat多光譜波段提取3個組分的散點圖時,從中選擇3個具有代表性的端元高反照率目標、低反照率目標和植被。然后利用混合像元分解的方法將Landsat8多光譜圖像分解為三分體圖像。
由于ISA主要存在于高反照率目標和低反照率目標的圖像中,因此,去除該圖像中的非不透水面區(qū)域至關(guān)重要。以往的研究表明,歸一化水體指數(shù)(normalized difference water index, NDWI)在從其他土地覆蓋類型中分離出水體是有效的,因此,可以利用歸一化水體指數(shù)來去除水體。由于初步ISA結(jié)果可能與其他土地覆蓋類型相混淆,因此除水體外,需要進行圖像后處理來進一步去除圖像中的非不透水面區(qū)域。
利用谷歌地球的高空間分辨率圖像對提取的ISA進行精度驗證,采用隨機抽樣的方法選擇驗證樣本,共選取600個樣本,其中包含400個非ISA樣本和200個ISA樣本。采用誤差矩陣來評估ISA精度,從誤差矩陣中計算生產(chǎn)者精度、用戶精度和總體精度。
由于在城市的發(fā)展建設中,道路、廣場、停車場、機場等地越來越發(fā)達,此類設施屬于不透水面但并非居住區(qū),因此,為了更加準確地對人口進行估計,需剔除不透水面中的非居民居住區(qū)域。OSM旨在為用戶提供免費且易于訪問的數(shù)字地圖資源,是現(xiàn)階段最受歡迎的自發(fā)地理信息數(shù)據(jù),這類數(shù)據(jù)與傳統(tǒng)的地理空間數(shù)據(jù)相比,具有豐富、實時、更新速度快等優(yōu)勢。因此,本文利用OSM數(shù)據(jù)對非居民區(qū)進行剔除。
R
)確定行政區(qū)尺度上人口密度估計的最佳估計模型。從2020年人口普查數(shù)據(jù)中可得北京市街道級別的人口數(shù),北京市共有337個街道,隨機抽取200個街道進行驗證并繪制殘差圖像。
區(qū)尺度的人口密度分布只是行政單位的平均值,沒有考慮不同的土地利用/覆蓋類型;因此,這種分布不能準確地表示人口密度分布的空間格局。我們可以假設人口只分布在ISA存在的地方,而沒有人口出現(xiàn)在其他土地使用類型,如森林、農(nóng)業(yè)用地和水體等。因此,像元大小處的人口密度可以表示為
(1)
其中,D
為像元處的人口密度;D
為行政區(qū)的人口密度;A
為行政區(qū)面積;f
為像元處的不透水面值;n
為該行政區(qū)內(nèi)的ISA像元個數(shù),非ISA的像元值為0。要建立基于ISA的人口密度估計模型,關(guān)鍵的一步是對ISA數(shù)據(jù)進行準確地提取。對ISA的精度評估結(jié)果如表1所示,北京市ISA精度的生產(chǎn)者精度和用戶精度分別為90.05%和86%,總體精度為92.17%。該研究進一步證實了基于LSMA的方法可以有效地從landsat8影像中提取ISA。
表1 ISA精度評定結(jié)果
北京市下轄16區(qū),總面積為16 410.54 km,根據(jù)2020年全國第七次人口普查數(shù)據(jù),北京市總?cè)丝跒?1 893 095人。北京市行政區(qū)劃人口密度為行政區(qū)總?cè)藬?shù)除以行政區(qū)面積,結(jié)果如圖2所示,可以看出北京市中心城區(qū)的人口密度大,圍繞中心呈發(fā)散狀,距離中心城區(qū)越遠,人口密度越小,西部和北部多為山區(qū),人口密度最小。但由于該方法所得單位面積人口呈均勻分布,在山體、水體或森林等無人居住的地區(qū)也存在人口分布情況,因此,需要基于不透水面的像元尺度的人口密度圖來解決這一問題。
圖2 北京市行政區(qū)人口密度[審圖號:GS(2019)3333號]
3.3.1
30
m
像元的人口密度模型建立由于行政區(qū)人口密度并未考慮人口與ISA之間的關(guān)系,為了進行更小尺度的人口密度圖繪制,需要建立人口與ISA之間關(guān)系的模型。將人口密度與ISA密度之間進行線性和非線性回歸分析。圖3展示了人口密度與ISA密度的散點圖,表明它們之間的關(guān)系可以用指數(shù)式(2)表示。
(2)
其中,D
為人口密度;D
為ISA密度。決定系數(shù)R
=0.
941 4,表明在行政區(qū)尺度上人口密度估計效果較好。圖3 人口密度與不透水面密度關(guān)系
利用模型反算行政區(qū)劃人口密度,并根據(jù)式(2)進行30 m像元大小的人口密度的計算,結(jié)果如圖4(b)所示,圖4(a)為基于原始ISA生成的人口密度,可以看出,剔除掉非居民區(qū)后的人口密度較之前的圖像降低了人口密度低估的問題,更加貼近實際情況。圖5為北京市Worldpop人口密度數(shù)據(jù),放大后可以看出,其人口分布沿道路擴散,且道路上人口密度最大,而道路明顯不屬于居民地,圖6則為最終北京市30 m像元人口密度及局部放大圖,相比目前已有的Worldpop人口密度數(shù)據(jù)更加精確和細致。其中,核心城區(qū)(東、西城區(qū))91%的人口分布在20人以上的像元中,最大可達每像元36人,而密云、懷柔、門頭溝和延慶地區(qū)每像元的人口均低于20人。該結(jié)果與行政區(qū)人口密度結(jié)果大體相似,依然顯示北京市中心城區(qū)人口密度大,西、北部山區(qū)地區(qū)人口密度小。但相比行政區(qū)尺度的人口密度圖,該圖可以顯示更多的空間細節(jié),而且彌補了人口出現(xiàn)在無人居住區(qū)的不足,更加符合實際人口居住情況。
(a)原始ISA生成的人口密度
(b)居民區(qū)ISA生成的人口密度
圖5 北京市Worldpop人口密度數(shù)據(jù)
圖6 北京市30 m像元人口密度圖
3.3.2
30
m
像元的人口密度模型驗證建立人口密度與ISA密度之間的模型后,需驗證該模型是否可用。利用北京市第七次人口普查鄉(xiāng)鎮(zhèn)街道級數(shù)據(jù)對該模型進行驗證,得出估計人口與參考人口之間的關(guān)系如圖7所示,表明了良好的線性關(guān)系,說明所建立的人口密度與ISA密度之間的模型可用。估計人口殘差如圖8所示。
圖7 估計人口與參考人口關(guān)系
圖8 估計人口殘差
本研究基于北京市行政區(qū)人口密度與不透水面密度數(shù)據(jù)之間的關(guān)系,為30 m像元尺度上的人口密度分布圖提供了一種新的方法,首先,利用Landsat8遙感影像提取北京市不透水面并驗證其精度。其次,建立行政區(qū)人口密度與不透水面密度之間的關(guān)系。最后,假設人口只存在于不透水面地區(qū),并用OSM數(shù)據(jù)剔除道路、停車場等非居民區(qū),將人口數(shù)據(jù)反算到30 m像元尺度,實現(xiàn)人口密度空間化制圖。該方法為人口密度分布的空間格局提供了豐富的信息,具有利用遙感數(shù)據(jù)快速更新人口密度的潛力,對沒有普查數(shù)據(jù)的發(fā)展中國家尤其有價值。但在實際發(fā)展中,建筑高度是影響人口密度估算的一個重要因素,因此,需要進行更多的研究,將土地利用類型和建筑物高度納入遙感數(shù)據(jù),以便建立更為完善的人口密度估計模型。