王 恒,江麗鈞
(1.麗水市建設(shè)技術(shù)管理中心,浙江 麗水 323000)
城市建成區(qū)是指城市行政區(qū)內(nèi)實(shí)質(zhì)已成片開(kāi)發(fā)建設(shè)、市政公用設(shè)備和公共設(shè)備基本具備的地區(qū)[1],其范圍是衡量城市化發(fā)展水平的重要指標(biāo)。我國(guó)城市建成區(qū)的提取和劃分主要依據(jù)政府統(tǒng)計(jì)年鑒和規(guī)劃文件,而城市建成區(qū)是動(dòng)態(tài)變化的,研究城市擴(kuò)張需要持續(xù)監(jiān)測(cè)建成區(qū)的變化,但無(wú)法從《中國(guó)城市統(tǒng)計(jì)年鑒》中獲得城市建成區(qū)的準(zhǔn)確時(shí)間序列[2]。雖然近年來(lái)衛(wèi)星遙感、興趣點(diǎn)(POI)等社會(huì)大數(shù)據(jù)開(kāi)放程度大大提高,但由于城市建成區(qū)的復(fù)雜性,準(zhǔn)確獲取動(dòng)態(tài)建成區(qū)仍是一項(xiàng)具有挑戰(zhàn)性的工作。
城市建成區(qū)提取方法主要包括兩種:①基于單一數(shù)據(jù)源的提取,如參考文獻(xiàn)[3]~[6]根據(jù)城市建成區(qū)燈光亮度值明顯高于其他地區(qū)這一特征,利用夜光遙感數(shù)據(jù)提取城市建成區(qū)范圍,但城市中心夜光遙感數(shù)據(jù)存在明顯的光飽和[3],導(dǎo)致提取區(qū)域大于實(shí)際范圍,且存在開(kāi)花效應(yīng),影響提取精度,參考文獻(xiàn)[7]、[8]利用POI在城市與農(nóng)村邊界處的密度突然變化這一特征提取城市建成區(qū),但受限于本身數(shù)據(jù)質(zhì)量和閾值選擇,城市建成區(qū)提取精度不高;②多源數(shù)據(jù)融合提取,如參考文獻(xiàn)[9]~[14]通過(guò)融合POI 與燈光數(shù)據(jù),利用閾值法提取城市建成區(qū),該方法能在一定程度上實(shí)現(xiàn)數(shù)據(jù)互補(bǔ),但仍存在邊界溢出、閾值選取受人為主觀因素影響等問(wèn)題,參考文獻(xiàn)[15]通過(guò)融合POI 與不透水面指數(shù)來(lái)提取建成區(qū),在局部可獲得較好效果。上述方法在提取建成區(qū)方面都具有合理性,但也有自身缺陷,參考文獻(xiàn)[16]~[18]利用深度神經(jīng)網(wǎng)絡(luò)來(lái)解決遙感數(shù)據(jù)提取道路、土地覆蓋分類(lèi)等問(wèn)題,結(jié)果優(yōu)于傳統(tǒng)方法。目前尚無(wú)研究利用多源數(shù)據(jù)融合結(jié)合深度學(xué)習(xí)提取建成區(qū),因此本文提出一種融合夜光、POI 數(shù)據(jù)并結(jié)合深度學(xué)習(xí)的城市建成區(qū)提取方法,以彌補(bǔ)傳統(tǒng)方法的不足,提高城市建成區(qū)提取的準(zhǔn)確性。
夜光數(shù)據(jù)采用2018年7月珞珈一號(hào)影像,空間分辨率為130 m,幅寬為260 km。POI數(shù)據(jù)來(lái)源于2018年高德地圖數(shù)據(jù),包括餐飲、購(gòu)物、文化、生活、公園等。由于Sentinel-2 的B2、B4、B6、B11 和B12 波段對(duì)建筑用地提取有積極影響[19],因此本文采用這5 個(gè)波段數(shù)據(jù)的合成影像,空間分辨率為10 m?!?018 年城鄉(xiāng)建設(shè)統(tǒng)計(jì)年鑒》數(shù)據(jù)來(lái)源于住房和城鄉(xiāng)建設(shè)部。
1.2.1 夜光數(shù)據(jù)處理方法
為減少光飽和的影響,對(duì)珞珈夜光遙感數(shù)據(jù)進(jìn)行輻射校正,采用數(shù)據(jù)分發(fā)網(wǎng)站提供的公式:
式中,L為絕對(duì)輻射較正后的輻射亮度值,單位為W/(m2?sr?μm);DN為圖像灰度值。
為消除珞珈數(shù)據(jù)的地理參考誤差,本文參照遙感影像進(jìn)行幾何校正,通過(guò)閾值分割獲取目標(biāo)數(shù)據(jù)。
1.2.2 POI數(shù)據(jù)處理方法
本文采用核密度估計(jì)分析POI 數(shù)據(jù),通過(guò)閾值分割獲取目標(biāo)數(shù)據(jù)。估算公式為:
式中,n為樣本數(shù)量;h為帶寬;K為核函數(shù);x為計(jì)算函數(shù)的向量;Xj為樣本向量。
本文使用的核函數(shù)基于四次核函數(shù),即
1.2.3 ResUNet深度學(xué)習(xí)方法
參考文獻(xiàn)[19]利用深度殘差ResUNet,基于遙感影像提取道路網(wǎng),并取得了良好效果。本文利用ResUNet方法對(duì)哨兵2號(hào)衛(wèi)星遙感影像進(jìn)行深度學(xué)習(xí)提取建設(shè)用地?cái)?shù)據(jù)。具體訓(xùn)練步驟為:①首先下載目標(biāo)區(qū)域哨兵2號(hào)遙感影像,利用ENVI軟件合成目標(biāo)波段,裁剪興趣區(qū)域,形成訓(xùn)練影像數(shù)據(jù),再通過(guò)ArcGIS軟件提取Esri Land Cover 2020 10 m土地覆蓋數(shù)據(jù)中的建設(shè)用地作為訓(xùn)練標(biāo)簽數(shù)據(jù);②由于深度學(xué)習(xí)框架不能直接使用現(xiàn)有的樣本數(shù)據(jù),因此采用滑動(dòng)窗口方法將樣本數(shù)據(jù)制作成256×256 大小的圖片,步長(zhǎng)為128 像素,對(duì)圖像進(jìn)行90°、180°、270°旋轉(zhuǎn)增強(qiáng)處理,對(duì)切片數(shù)據(jù)在0~1 范圍內(nèi)進(jìn)行歸一化處理;③隨機(jī)選取90%樣本數(shù)據(jù)作為訓(xùn)練集,10%樣本數(shù)據(jù)作為驗(yàn)證集;④采用Keras框架進(jìn)行ResUNet學(xué)習(xí)模型的數(shù)據(jù)訓(xùn)練,網(wǎng)絡(luò)迭代次數(shù)為50,以二分類(lèi)交叉熵作為損失函數(shù)來(lái)評(píng)估訓(xùn)練性能,采用Adam 優(yōu)化器調(diào)整學(xué)習(xí)率,初始學(xué)習(xí)率為0.000 1,訓(xùn)練損失值連續(xù)5個(gè)迭代次數(shù)不降低時(shí),學(xué)習(xí)率衰減一半,保存基于驗(yàn)證損失的最優(yōu)模型;⑤對(duì)目標(biāo)區(qū)域遙感影像進(jìn)行預(yù)測(cè)。
1.2.4 數(shù)據(jù)歸一化處理方法
由于各因子核密度的數(shù)量級(jí)不同,因此本文對(duì)夜光遙感數(shù)據(jù)、POI 數(shù)據(jù)、深度學(xué)習(xí)提取數(shù)據(jù)進(jìn)行歸一化處理。根據(jù)數(shù)據(jù)標(biāo)準(zhǔn)化原理,本文采用最小—最大值歸一化方法進(jìn)行標(biāo)準(zhǔn)化,消除因子大小差異對(duì)精度的影響。
式中,xi為第i個(gè)因子的值;minxi、maxxi分別為xi的最小、最大值。
1.2.5 數(shù)據(jù)融合方法
幾何平均可在圖像融合中有效消除圖像極值的影響,保留圖像的原始信息,因此得到了廣泛應(yīng)用[20],融合后的數(shù)據(jù)可消除密度分析值過(guò)大造成的數(shù)量級(jí)差異,且在一定程度上消除了夜光圖像的背景噪聲,減少了光線溢出的影響。本文采用幾何平均數(shù)融合ResUnet學(xué)習(xí)數(shù)據(jù)、夜光數(shù)據(jù)和POI數(shù)據(jù),計(jì)算公式為:
式中,IUrban 為綜合指數(shù);Pi為POI 核密度灰度值;Ri為ResUNet 學(xué)習(xí)數(shù)據(jù)灰度值;Ni為夜光數(shù)據(jù)灰度值。
1.2.6 精確度評(píng)估
本文以實(shí)際建成區(qū)為參考進(jìn)行精確度評(píng)估,通過(guò)統(tǒng)計(jì)分類(lèi)評(píng)價(jià)指標(biāo)[21]精確率(precision)、召回率(recall)、F1分?jǐn)?shù)進(jìn)行定量評(píng)估。
式中,TP為模型提取結(jié)果為建成區(qū),實(shí)際也是建成區(qū)的面積;FP為模型提取結(jié)果為建成區(qū),實(shí)際不是建成區(qū)的面積;FN為模型提取結(jié)果不是建成區(qū),實(shí)際是建成區(qū)的面積。
數(shù)據(jù)處理流程包括夜光數(shù)據(jù)提取建成區(qū)、POI數(shù)據(jù)提取建成區(qū)、遙感影像提取建成區(qū)和多源數(shù)據(jù)融合提取建成區(qū)等內(nèi)容,具體工作流程見(jiàn)圖1。
圖1 數(shù)據(jù)處理流程圖
本文選取浙江省杭州市和麗水市數(shù)據(jù)進(jìn)行城市建成區(qū)提取研究,分別利用夜光數(shù)據(jù)、POI 數(shù)據(jù)以及本文提出的多源數(shù)據(jù)融合方法提取建成區(qū),并對(duì)3 種方法的提取結(jié)果進(jìn)行比較分析。
杭州市采用2018 年高德POI 數(shù)據(jù)(23 大類(lèi),約84 萬(wàn)個(gè)點(diǎn))進(jìn)行核密度分析,采用閾值分割法提取建成區(qū)邊界;麗水市采用2018 年天地圖POI 數(shù)據(jù)(10大類(lèi),約18萬(wàn)個(gè)點(diǎn))進(jìn)行核密度分析,采用閾值分割法提取建成區(qū)邊界;對(duì)公園POI數(shù)據(jù)進(jìn)行單獨(dú)處理,提取范圍后再融合到最后的成果中,提取結(jié)果見(jiàn)圖2,可以看出,POI 數(shù)據(jù)提取城市建成區(qū)邊界較平滑,周?chē)D斑較少,采用合適的閾值可有效去除周邊的村莊、集鎮(zhèn),但POI數(shù)據(jù)進(jìn)行核密度分析后邊界數(shù)據(jù)溢出問(wèn)題較突出(圖中紅色框部分)。
圖2 POI數(shù)據(jù)提取建成區(qū)結(jié)果
利用夜光數(shù)據(jù)對(duì)杭州市和麗水市進(jìn)行了建成區(qū)提取,并對(duì)提取結(jié)果進(jìn)行圖斑綜合,結(jié)果見(jiàn)圖3,可以看出,夜光遙感影像提取建成區(qū)范圍能反映城市的輪廓、邊界清晰,但周邊存在很多分散的小區(qū)域,且建成區(qū)范圍線內(nèi)存在不少面積較大的空洞,圖中標(biāo)記1、2、3、5位于學(xué)校附近,由于影像獲取時(shí)間正是學(xué)校暑假時(shí)間,因此夜光暗淡,使城市建成區(qū)提取產(chǎn)生較大偏差;標(biāo)記6、7 為建成區(qū)內(nèi)公園,公園夜光較暗,容易因閾值選取而被剔除;標(biāo)記8 為河面,部分區(qū)域夜光明亮,存在光溢現(xiàn)象。
圖3 夜光遙感影像建成區(qū)提取
本文選取2020 年12 月南京市區(qū)及其周邊范圍的哨兵2 號(hào)影像以及Esri Land Cover 2020 10 m 土地覆蓋中的建設(shè)用地(Built Area)數(shù)據(jù)作為訓(xùn)練的輸入數(shù)據(jù),按照數(shù)據(jù)處理流程進(jìn)行深度學(xué)習(xí),訓(xùn)練曲線見(jiàn)圖4,曲線網(wǎng)絡(luò)的訓(xùn)練損失(TrainLoss)和驗(yàn)證損失(ValLoss)隨訓(xùn)練次數(shù)的增加而減小并收斂;訓(xùn)練精度(TrainAccuracy)和驗(yàn)證精度(ValAccuracy)隨訓(xùn)練次數(shù)的增加而提高并收斂。模型選取驗(yàn)證損失最小值時(shí)的模型用于后續(xù)數(shù)據(jù)的預(yù)測(cè)。
圖4 ResUNet網(wǎng)絡(luò)訓(xùn)練
利用訓(xùn)練好的模型對(duì)目標(biāo)遙感影像進(jìn)行預(yù)測(cè)提取,并對(duì)圖斑進(jìn)行綜合處理獲取建設(shè)用地范圍,提取數(shù)據(jù)為地面上有建筑物的地塊,結(jié)果見(jiàn)圖5,可以看出,提取范圍中包括很多分散的小區(qū)塊,主要為城市周邊的村莊、小鎮(zhèn),其中麗水城區(qū)遙感影像部分區(qū)域存在云層(圖中a、b區(qū)域),影響建設(shè)用地提取。
圖5 深度學(xué)習(xí)建設(shè)用地提取
本文按照數(shù)據(jù)處理流程和方法進(jìn)行數(shù)據(jù)融合,提取杭州市和麗水市的建成區(qū),并對(duì)圖斑數(shù)據(jù)進(jìn)行綜合,結(jié)果見(jiàn)圖6,可以看出,標(biāo)記1、3 為學(xué)校區(qū)域,在采用夜光數(shù)據(jù)提取時(shí)被剔除;利用POI或夜光數(shù)據(jù)提取城市建成區(qū)時(shí)存在數(shù)據(jù)溢出現(xiàn)象(標(biāo)記2、4),導(dǎo)致邊界范圍不準(zhǔn)確,但采用數(shù)據(jù)融合后能有效彌補(bǔ)單一數(shù)據(jù)源的不足。
圖6 杭州、麗水市區(qū)融合后建成區(qū)成果
以麗水市為例,本文分別比較了3 種方法的提取精度,計(jì)算結(jié)果見(jiàn)表1,可以看出,多源數(shù)據(jù)融合方法的整體精度最優(yōu)。以2018年杭州市地理國(guó)情公報(bào)數(shù)據(jù)和麗水市住房和城鄉(xiāng)建設(shè)廳2018 年城鄉(xiāng)建設(shè)統(tǒng)計(jì)年鑒為檢查數(shù)據(jù),與融合后的數(shù)據(jù)進(jìn)行比較,結(jié)果見(jiàn)表2,其中杭州市統(tǒng)計(jì)數(shù)據(jù)不包含臨安區(qū)、富陽(yáng)區(qū)數(shù)據(jù),可以看出,基于多源數(shù)據(jù)融合提取建成區(qū)與實(shí)際數(shù)值基本一致。
表1 多源數(shù)據(jù)融合提取建成區(qū)精度評(píng)定
表2 提取建成區(qū)面積與實(shí)際建成區(qū)面積比較
從3 種提取方法結(jié)果來(lái)看,多源數(shù)據(jù)融合方法能更準(zhǔn)確地反映城市建成區(qū)的實(shí)際范圍,充分實(shí)現(xiàn)多源數(shù)據(jù)的互補(bǔ),集中表現(xiàn)在:①城鄉(xiāng)分界明顯,采用POI 和夜光數(shù)據(jù)提取的建成區(qū)范圍,在城市和非城市區(qū)域界限非常明顯,該方法充分利用這一優(yōu)勢(shì),消除了城市周邊的噪聲,減少了人工判讀工作量,提高了提取效率;②融合互補(bǔ),多源數(shù)據(jù)融方法能實(shí)現(xiàn)數(shù)據(jù)互補(bǔ),圖6的實(shí)際提取結(jié)果說(shuō)明了這一點(diǎn)。
本文分別采用POI 數(shù)據(jù)、夜光數(shù)據(jù)、多源數(shù)據(jù)融合提取建成區(qū),并與已知的建成區(qū)數(shù)據(jù)進(jìn)行比較,以評(píng)價(jià)各方法的提取精度。結(jié)果表明,多源數(shù)據(jù)融合方法的提取精度最高,能克服單一數(shù)據(jù)提取方法建成區(qū)內(nèi)部數(shù)據(jù)空洞、溢出效應(yīng)問(wèn)題,所用遙感影像獲取周期短、POI 數(shù)據(jù)獲取便捷、方法操作相對(duì)簡(jiǎn)單,可保證城市建成區(qū)提取的時(shí)效性。在未來(lái)研究中將繼續(xù)朝多源數(shù)據(jù)融合方向發(fā)展,充分利用深度學(xué)習(xí)工具進(jìn)一步簡(jiǎn)化提取流程,提高自動(dòng)化提取程度。