王李良,張修宇
(華北水利水電大學(xué),河南 鄭州 450045)
不透水面是指由不透水材料制成的人造表面,如硬化道路、建筑物屋頂、低滲透率的停車場(chǎng)等,是城市化水平的重要指標(biāo)[1-4]。 改革開(kāi)放以來(lái),我國(guó)城鎮(zhèn)化率不斷提高,不透水面面積逐年增大,在滿足經(jīng)濟(jì)社會(huì)發(fā)展用地需求的同時(shí)形成了許多城市病,如熱島效應(yīng)、雨島效應(yīng)、城市內(nèi)澇等[5]。 科學(xué)認(rèn)識(shí)不透水面時(shí)空變化特征,對(duì)于制定科學(xué)合理的區(qū)域發(fā)展規(guī)劃,解決城市洪澇災(zāi)害等問(wèn)題具有重要意義。
通過(guò)遙感技術(shù)獲得的影像數(shù)據(jù)具有大范圍、低成本、重復(fù)觀測(cè)等優(yōu)勢(shì),為長(zhǎng)時(shí)序不透水面提取提供了優(yōu)質(zhì)數(shù)據(jù)源。 近年來(lái),國(guó)內(nèi)外學(xué)者提出了許多不透水面提取方法[6],其中指數(shù)法是一種典型的不透水面提取方法,其通過(guò)光譜變換增強(qiáng)不透水面信息同時(shí)抑制透水面信息,然后通過(guò)閾值分割提取不透水面。 李健等[7]使用歸一化建筑指數(shù)(NDBI)對(duì)不同季節(jié)的城鎮(zhèn)用地進(jìn)行提取分析,發(fā)現(xiàn)提取夏季的不透水面精確度最高。 穆亞超等[8]提出了增強(qiáng)型不透水面指數(shù)(END?ISI),可用于高效提取干旱地區(qū)的不透水面。 Wang Zhaoqi 等[9]提出歸一化差異不透水指數(shù)(NDII)并用來(lái)提取不透水面面積,得到了較高的提取精度。TANG Yun 等[10]利用夜間燈光指數(shù)提取不透水面??傮w而言,利用不透水面指數(shù)可以簡(jiǎn)單快捷提取大面積不透水面,但是分類結(jié)果受分割閾值影響較大,而且確定最佳分割閾值較難。 機(jī)器學(xué)習(xí)分類法是另一種常用的不透水面提取方法。 常翔宇等[11]使用隨機(jī)森林分類法,以2017 年長(zhǎng)春市為例進(jìn)行不透水面提取,提取總體精度達(dá)到94%。 周峰等[12]利用水體指數(shù)、植被指數(shù)、建筑指數(shù)構(gòu)建決策樹(shù)模型,進(jìn)行平原區(qū)不透水面提取,得出不透水面以東、以南為主要擴(kuò)張方向,年均擴(kuò)張速度為6.7 km2。 袁修柳等[13]利用分類回歸樹(shù)法,提取武漢市2015 年不透水面面積,結(jié)果表明武漢市2015 年不透水面呈現(xiàn)顯著的空間自相關(guān)。 蔡博文等[14]建立深度學(xué)習(xí)模型,實(shí)現(xiàn)武漢市不透水面的自動(dòng)提取,結(jié)果表明江漢區(qū)和武昌區(qū)2 個(gè)核心主城區(qū)不透水面占比超過(guò)60%。 邵振峰等[15]利用支持向量機(jī)方法,提取武漢市的不透水面面積。 Yu S S 等[16]利用基于像素和面向?qū)ο蟮闹С窒蛄繖C(jī)分類算法,提取孟買市的不透水面。
已有研究表明,機(jī)器學(xué)習(xí)分類法的不透水面提取精度普遍高于指數(shù)法[17],但該類方法需要大量有代表性的不透水面訓(xùn)練樣本,在大尺度、長(zhǎng)時(shí)序不透水面提取研究中獲取訓(xùn)練樣本通常需要消耗大量的人力物力。 此外,傳統(tǒng)的遙感數(shù)據(jù)處理平臺(tái)(如ENVI、PEI、ERDAS 等)需要將數(shù)據(jù)下載到本地,難以滿足快速信息化背景下遙感大數(shù)據(jù)的應(yīng)用需求。 Google Earth En?gine(GEE)是由Google 公司開(kāi)發(fā)的遙感大數(shù)據(jù)分析計(jì)算和地理信息數(shù)據(jù)可視化的綜合性云服務(wù)平臺(tái),集成了PB 級(jí)遙感數(shù)據(jù)和海量的地理信息數(shù)據(jù)處理算法,可有效解決大尺度、長(zhǎng)時(shí)序地表覆蓋研究和專題要素制圖中數(shù)據(jù)獲取難、處理效率低的難題,是現(xiàn)階段廣泛采用的遙感大數(shù)據(jù)處理分析平臺(tái)。 鑒于此,本文利用GEE 云平臺(tái)[18-20]大尺度、長(zhǎng)時(shí)序數(shù)據(jù)分析功能,根據(jù)Landsat 衛(wèi)星遙感影像提取河南省引黃受水區(qū)1990—2020 年的不透水面信息,并選取面積增長(zhǎng)率、擴(kuò)張強(qiáng)度等指標(biāo),分析該區(qū)域不透水面時(shí)空變化特征,以期為該區(qū)域發(fā)展規(guī)劃提供數(shù)據(jù)支撐。
河南省引黃受水區(qū)包括鄭州、開(kāi)封、洛陽(yáng)、平頂山、安陽(yáng)、鶴壁、新鄉(xiāng)、焦作、濮陽(yáng)、許昌、三門峽、商丘、周口、濟(jì)源14 個(gè)地級(jí)市(見(jiàn)圖1)。 2020 年研究區(qū)有8 141萬(wàn)人口,生產(chǎn)總值為47 459 億元,是河南省的重要輻射區(qū),也是我國(guó)重要的人口密集區(qū)、農(nóng)業(yè)生產(chǎn)區(qū)和交通樞紐區(qū)。 研究區(qū)屬于嚴(yán)重缺水地區(qū),水資源利用效率較低,水資源安全保障能力不足。 正確認(rèn)識(shí)河南省引黃受水區(qū)不透水面時(shí)空變化特征,對(duì)于推動(dòng)黃河流域生態(tài)保護(hù)和高質(zhì)量發(fā)展戰(zhàn)略具有重要意義。 然而,現(xiàn)階段針對(duì)該區(qū)域不透水面時(shí)空變化的研究較少,不透水面時(shí)空變化特征尚不清晰,嚴(yán)重制約了該區(qū)域的科學(xué)規(guī)劃和高質(zhì)量發(fā)展。
將GEE 云平臺(tái)上集成的數(shù)字高程模型和Landsat 5/7/8 衛(wèi)星遙感影像作為主要數(shù)據(jù)源。 數(shù)字高程模型采用NASA SRTM Digital Elevation Data 30 m 數(shù)據(jù)產(chǎn)品,該數(shù)據(jù)產(chǎn)品是利用雷達(dá)干涉測(cè)量法生成的高精度全球30 m 數(shù)字高程模型,是現(xiàn)階段廣泛采用的數(shù)字高程模型。 受Landsat 衛(wèi)星發(fā)射時(shí)間和數(shù)據(jù)質(zhì)量的制約,在本研究中1990—2010 年不透水面提取采用Landsat 5 TM 遙感影像,2012 年不透水面提取采用Landsat 7 ETM+遙感影像,其余年份采用Landsat 8 OLI 遙感影像。 生產(chǎn)總值和人口資料來(lái)源于1990—2020 年《河南省統(tǒng)計(jì)年鑒》。
本研究基于Landsat 衛(wèi)星遙感數(shù)據(jù),首先進(jìn)行融合鑲嵌和裁剪拼接,利用GEE 平臺(tái)的Landsat 影像去云算法(Simple Cloud Score 函數(shù))對(duì)河南省引黃受水區(qū)的遙感影像進(jìn)行處理,得到去云圖像,選取大量樣本作為區(qū)分不透水面和透水面的基礎(chǔ)樣本,在平臺(tái)完成編程之后,使用隨機(jī)森林分類法對(duì)圖像進(jìn)行不透水面分類,得到不透水面初步分類結(jié)果,再利用總體精度和Kappa 系數(shù)進(jìn)行精度評(píng)價(jià),達(dá)到要求后,使用ArcGIS軟件對(duì)數(shù)據(jù)進(jìn)行提取,并將提取結(jié)果與生產(chǎn)總值和人口進(jìn)行相關(guān)性分析。
(1)數(shù)據(jù)預(yù)處理。 首先創(chuàng)建一個(gè)函數(shù)進(jìn)行云掩膜處理,將檢測(cè)出的云以及云陰影像元數(shù)值設(shè)置為0,利用云量得分掩膜云以及云陰影影像,對(duì)每個(gè)像元求得中值,復(fù)制影像時(shí)間屬性,對(duì)相應(yīng)時(shí)間屬性的Landsat影像進(jìn)行加載,以真彩色顯示研究區(qū)域的遙感影像。
(2)樣本選取。 先對(duì)研究區(qū)遙感影像進(jìn)行預(yù)處理,并結(jié)合Google 地圖選擇樣本。 初步在研究范圍內(nèi)選取1 316 個(gè)樣本,其中不透水面樣本683 個(gè)、透水面樣本633 個(gè)。 然后,在GEE 平臺(tái)上運(yùn)行土地分類程序,當(dāng)總體精度達(dá)到90%且通過(guò)人工目視的方法對(duì)分類結(jié)果進(jìn)行識(shí)別沒(méi)有大量漏檢和誤檢情況時(shí),將樣本作為整體樣本,再逐年對(duì)樣本進(jìn)行更正。
隨機(jī)森林分類算法(RF)是一種多決策樹(shù)集成監(jiān)督分類算法,與其他機(jī)器學(xué)習(xí)分類算法(如支持向量機(jī)分類法、人工神經(jīng)網(wǎng)絡(luò)模型、決策樹(shù)分類法)相比,該算法能夠有效避免模型過(guò)擬合問(wèn)題,且模型參數(shù)少、分類精度高,已廣泛應(yīng)用于不透水面提取、地表水體制圖、土地覆蓋分類等研究。 因此,本文采用隨機(jī)森林分類法提取河南省引黃受水區(qū)逐年不透水面信息,步驟如下。
(1)建立不透水面分類特征空間。 結(jié)合已有研究成果,選取衛(wèi)星遙感影像光譜特征,構(gòu)建河南省引黃受水區(qū)不透水面分類特征空間。
(2)選取訓(xùn)練樣本。 采用分層隨機(jī)采樣方法,按照7 ∶3 的比例將樣本分為訓(xùn)練樣本和精度評(píng)價(jià)樣本。
(3)隨機(jī)森林分類模型訓(xùn)練。 設(shè)置隨機(jī)森林分類模型關(guān)鍵參數(shù):決策樹(shù)數(shù)目(K)和分裂節(jié)點(diǎn)特征數(shù)(m)。 根據(jù)隨機(jī)森林分類的袋外(OOB)誤差理論,隨著決策樹(shù)數(shù)目的增大,隨機(jī)森林分類精度增高,但分類過(guò)程中消耗的時(shí)間成本和內(nèi)存成本也相應(yīng)增大。 為了平衡分類精度和分類成本,通常選取OOB 誤差函數(shù)收斂時(shí)的決策樹(shù)數(shù)目。 研究表明,m的取值與分類特征數(shù)(n)有密切關(guān)系,通常取的整數(shù)。 通過(guò)多次測(cè)試,本研究K值取25、m值取2。
(4)單時(shí)相不透水面提取。 將單時(shí)相數(shù)據(jù)集代入步驟(3)訓(xùn)練好的隨機(jī)森林分類模型,得出單時(shí)相不透水面提取結(jié)果。
結(jié)合已有研究,使用Kappa系數(shù)來(lái)衡量分類結(jié)果的精度,通過(guò)總體精度(OA)反映分類結(jié)果的總體誤差情況。
總體精度(OA)計(jì)算公式為
Kappa系數(shù)計(jì)算公式為
式中:N為精度評(píng)價(jià)樣本數(shù);Pe為偶然一致性誤差;TP為真實(shí)不透水面識(shí)別為不透水面的面積;FN為真實(shí)不透水面識(shí)別為透水面的面積;FP為真實(shí)透水面識(shí)別為不透水面的面積;TN為真實(shí)透水面識(shí)別為透水面的面積。
對(duì)所有時(shí)相不透水面提取結(jié)果進(jìn)行精度評(píng)價(jià),結(jié)果見(jiàn)圖2。 可知,1990—2020 年河南省引黃受水區(qū)不透水面提取結(jié)果總體精度均高于0.950;除2000 年(0.792)和2002 年(0.798),不透水面提取的Kappa系數(shù)均大于0.800。
不透水面時(shí)空擴(kuò)張數(shù)量主要從面積和擴(kuò)張速率兩方面進(jìn)行分析。
面積增長(zhǎng)量計(jì)算公式為
面積增長(zhǎng)率計(jì)算公式為
擴(kuò)張速率計(jì)算公式為
擴(kuò)張強(qiáng)度指數(shù)計(jì)算公式為
式中:Si和Sj分別為第i時(shí)相和第j時(shí)相(i<j)的研究區(qū)不透水面面積;T為時(shí)間,T=j(luò)-i。
結(jié)合已有研究文獻(xiàn),根據(jù)擴(kuò)張強(qiáng)度指數(shù),將城市擴(kuò)張分為高速擴(kuò)張(M≥1.92)、快速擴(kuò)張( 1.05 ≤M <1.92)、中 速 擴(kuò) 張( 0.59 ≤M <1.05)、低 速 擴(kuò) 張(0.28≤M<0.59)、緩慢擴(kuò)張( 0 ≤M <0.28)5 種狀態(tài)。
經(jīng)過(guò)測(cè)試和預(yù)計(jì)算對(duì)編寫的程序和樣本調(diào)整后,經(jīng)過(guò)GEE 平臺(tái)計(jì)算后得到分類后的研究區(qū)不透水面圖像,利用ArcGIS 計(jì)算研究區(qū)不透水面面積,結(jié)果見(jiàn)圖3。 可以看出,研究區(qū)和各地級(jí)市不透水面面積均呈逐年增大趨勢(shì),研究區(qū)不透水面總面積從1990 年的353 km2增大到2020 年的7 598 km2。
1992—2020 年河南省引黃受水區(qū)不透水面擴(kuò)張?zhí)卣饕?jiàn)表1(表中為每隔2 a 的數(shù)據(jù))。 從擴(kuò)張強(qiáng)度指數(shù)看,1992—2020 年研究區(qū)不透水面直處于緩慢擴(kuò)張狀態(tài), 2020 年不透水面擴(kuò)張速率最大(500.22 km2/a),1992 年增長(zhǎng)速率最?。?3.59 km2/a)。
表1 河南省引黃受水區(qū)不透水面擴(kuò)張?zhí)卣?/p>
河南省引黃受水區(qū)不同時(shí)期的不透水面變化情況見(jiàn)圖4。 各地級(jí)市的不透水面主要集中在城市,其次是鄉(xiāng)鎮(zhèn)和農(nóng)村等人類居住區(qū)。 不透水面面積呈逐年增大趨勢(shì),1996—2004 年面積增長(zhǎng)率較大,在30%以上。從不透水面提取情況來(lái)看,大多數(shù)農(nóng)村地區(qū)不透水面面積逐年增大,原因可能是經(jīng)濟(jì)發(fā)展改善了農(nóng)村道路、硬化路面面積逐漸增大。 2008—2020 年面積增長(zhǎng)率逐漸穩(wěn)定在11%~16%,說(shuō)明不透水面擴(kuò)張速度逐漸趨于穩(wěn)定。
鄭州市主城區(qū)不同時(shí)期的不透水面變化情況見(jiàn)圖5(紅色代表不透水面,綠色代表透水面)。 1990—2020 年,鄭州市不透水面從主城區(qū)逐漸擴(kuò)大到周邊地區(qū),呈現(xiàn)顯著的增長(zhǎng)趨勢(shì)。 鄭州市不透水面面積和面積增長(zhǎng)率始終大于其他各地級(jí)市的,說(shuō)明其作為省會(huì)城市發(fā)展速度最快、城鎮(zhèn)化水平最高,其中鄭州市2020 年不透水面面積為2 449 km2。
城市發(fā)展離不開(kāi)社會(huì)經(jīng)濟(jì)等因素的發(fā)展,而生產(chǎn)總值和人口作為社會(huì)經(jīng)濟(jì)的基礎(chǔ)指標(biāo),對(duì)社會(huì)經(jīng)濟(jì)有著不可缺少的作用,故選取生產(chǎn)總值和人口分析河南省引黃受水區(qū)不透水面變化的驅(qū)動(dòng)力。 不透水面與生產(chǎn)總值、人口相關(guān)性見(jiàn)圖6。
(1)生產(chǎn)總值。 河南省引黃受水區(qū)生產(chǎn)總值從1990 年的677 億元增長(zhǎng)到2020 年的47 459 億元,經(jīng)濟(jì)增速為1 559 億元/a。 由圖6 可知,不透水面面積與生產(chǎn)總值擬合優(yōu)度為0.980,說(shuō)明不透水面面積與經(jīng)濟(jì)發(fā)展有顯著的相關(guān)性。
(2)人口。 人口是城市發(fā)展的重要因素之一,人口越多,代表著一個(gè)城市越具有活力和發(fā)展前景。 河南省引黃受水區(qū)人口從1990 年的5 673 萬(wàn)增長(zhǎng)到2020 年的8 141 萬(wàn),平均增速為82 萬(wàn)人/a。 由圖6 可知,不透水面面積與人口顯著正相關(guān)(R2=0.912),說(shuō)明人口增長(zhǎng)對(duì)不透水面擴(kuò)張有正向影響。
(1)本研究提取不透水面的總體精度高于0.95,Kappa系數(shù)大于0.79,說(shuō)明利用GEE 平臺(tái)提取不透水面的精度較高。
(2)研究區(qū)不透水面面積從1990 年的353 km2增大到2020 年的7 598 km2,總體呈增大趨勢(shì)。 不透水面主要集中在城市,其次為鄉(xiāng)鎮(zhèn)和農(nóng)村。
(3)從不透水面變化的驅(qū)動(dòng)力來(lái)看,不透水面面積與生產(chǎn)總值和人口數(shù)量的擬合優(yōu)度分別為0.980 和0.912,說(shuō)明不透水面面積與生產(chǎn)總值和人口總數(shù)顯著正相關(guān),不透水面面積擴(kuò)張與經(jīng)濟(jì)和人口的增長(zhǎng)密切相關(guān)。