閆 智,李利偉,程 鋼
(1. 河南理工大學(xué)測繪與國土信息工程學(xué)院, 河南 焦作 454003; 2. 中國科學(xué)院遙感與數(shù)字地球研究所中國科學(xué)院數(shù)字地球重點(diǎn)實(shí)驗(yàn)室,北京 100094)
及時(shí)準(zhǔn)確地獲取不同類型建筑區(qū)空間分布信息,對城鎮(zhèn)化科學(xué)發(fā)展決策、環(huán)境保護(hù)等方面有重要意義。2016年開始全球免費(fèi)分發(fā)的10 m空間分辨率Sentinel-2多光譜數(shù)據(jù),具有幅寬大、成像時(shí)間短和觀測幾何比較穩(wěn)定的特點(diǎn),相對于高分辨率影像,更有利于大場景具有一定面積的結(jié)構(gòu)性地物的動態(tài)監(jiān)測。因此,研究利用Sentinel-2數(shù)據(jù)進(jìn)行不同類型建筑區(qū)提取具有很強(qiáng)的現(xiàn)實(shí)意義。
當(dāng)前應(yīng)用遙感技術(shù)進(jìn)行建筑區(qū)提取已有較多研究[1-5]。如文獻(xiàn)[1]利用譜間特征和歸一化指數(shù)實(shí)現(xiàn)了城市建筑用地的提??;文獻(xiàn)[2]運(yùn)用譜間特征和閾值相結(jié)合的方式對QuickBird高分辨率影像進(jìn)行了建筑區(qū)提??;文獻(xiàn)[3]應(yīng)用SAR影像進(jìn)行了建筑區(qū)提?。晃墨I(xiàn)[4]研究了典型民居類建筑區(qū)的遙感影像提取方法;文獻(xiàn)[5]提出了一種紋理特征與視覺注意機(jī)制相結(jié)合的方法進(jìn)行光學(xué)影像建筑區(qū)提取。這些研究將建筑區(qū)作為一個整體進(jìn)行提取,并沒有進(jìn)一步細(xì)分類型。
實(shí)際應(yīng)用中,不同類型建筑區(qū)的空間分布信息對于規(guī)劃管理和環(huán)境保護(hù)等有著不同的意義,如現(xiàn)代高層小區(qū)與傳統(tǒng)低矮村落在人口經(jīng)濟(jì)承載、資源能源利用及環(huán)境風(fēng)險(xiǎn)評估中有著不同的權(quán)重。當(dāng)前,國內(nèi)外對于多類型建筑區(qū)分類提取方面研究較少。文獻(xiàn)[6]利用Landsat7數(shù)據(jù)和基于紋理的方法提取了北京市城區(qū)內(nèi)高低層建筑區(qū)。
近年來深度網(wǎng)絡(luò)技術(shù)在自然圖像特征表達(dá)和分類識別上取得了巨大成功[7-10]。文獻(xiàn)[10]通過結(jié)合深度分層表達(dá)框架和編解碼思路提出了應(yīng)用于像素級語義分割的全卷積網(wǎng)絡(luò)。應(yīng)用深度網(wǎng)絡(luò)技術(shù)進(jìn)行遙感智能解譯已成為遙感信息提取領(lǐng)域的一個研究熱點(diǎn)[11-14]。
本文充分利用全卷積網(wǎng)絡(luò)(fully convolutional networks,F(xiàn)CN)在影像結(jié)構(gòu)特征表達(dá)和提取方面的優(yōu)勢,面向Sentinel-2多光譜數(shù)據(jù),構(gòu)建了一種基于全卷積網(wǎng)絡(luò)模型的高低層建筑區(qū)快速提取技術(shù),并結(jié)合雄安新區(qū)及其周邊Sentinel-2數(shù)據(jù)進(jìn)行精度驗(yàn)證和結(jié)果分析。
本研究選取Sentinel-2衛(wèi)星數(shù)據(jù)。該衛(wèi)星成像幅寬達(dá)290 km,同時(shí),通過雙星協(xié)同觀測實(shí)現(xiàn)中緯度地區(qū)約5 d重訪,包含4個10 m空間分辨率的可見光-近紅外通道,對于建筑區(qū)等地表結(jié)構(gòu)化地物動態(tài)監(jiān)測具有很強(qiáng)的應(yīng)用價(jià)值。
試驗(yàn)數(shù)據(jù)為2017年3月9日獲取的4幅Sentinel-2數(shù)據(jù)(對應(yīng)景號為50SLH、50SLJ、50SMH和50SMJ),該數(shù)據(jù)以雄安新區(qū)為中心,覆蓋北京南部、天津東部和河北大部區(qū)域,共4.4×104km2(有效區(qū)域約4.03×104km2),4幅影像拼接后如圖1所示。
建筑區(qū)劃分兼顧遙感影像結(jié)構(gòu)特征與實(shí)際功能類型。依據(jù)百度地圖和谷歌地球中高分影像判讀,結(jié)合重點(diǎn)區(qū)域?qū)嵉卣{(diào)查量測,對試驗(yàn)區(qū)典型建筑高度及其功能屬性進(jìn)行統(tǒng)計(jì)分析,以平均高度30 m(約10層)為界限,將研究區(qū)內(nèi)建筑區(qū)分為高層建筑區(qū)(建筑高度大于30 m、有明顯建筑陰影、建筑密度低,主要對應(yīng)高層現(xiàn)代化住宅區(qū)、高端寫字樓等,簡稱高層建筑區(qū))和低層建筑區(qū)(建筑高度小于30 m、沒有明顯建筑陰影,主要對應(yīng)鄉(xiāng)村村落、舊式住宅小區(qū)、別墅區(qū)、工業(yè)廠房和倉儲等,簡稱低層建筑區(qū))。
結(jié)合雄安新區(qū)周邊地貌特征,選擇任丘市和高碑店市作為訓(xùn)練樣區(qū)。在人工判讀高分影像和Sentinel-2試驗(yàn)數(shù)據(jù)的基礎(chǔ)上,對重點(diǎn)區(qū)域進(jìn)行實(shí)地考察,獲取樣區(qū)內(nèi)高層和底層建筑區(qū)的二值標(biāo)記柵格樣本。同時(shí),根據(jù)待提取地物尺寸對訓(xùn)練區(qū)域數(shù)據(jù)和類別標(biāo)記數(shù)據(jù)進(jìn)行裁剪,得到128×128像素大小的真彩色圖像和對應(yīng)二值標(biāo)記圖像,分別包括360組切片數(shù)據(jù)。為了降低模型復(fù)雜度和提高訓(xùn)練效率,高層和底層建筑區(qū)分別進(jìn)行提取。
為了驗(yàn)證算法提取結(jié)果,在訓(xùn)練樣區(qū)之外,考慮空間分布和地物代表性,選擇8個區(qū)域作為驗(yàn)證樣區(qū),依據(jù)高分影像判讀獲取驗(yàn)證區(qū)建筑區(qū)類型,對于結(jié)構(gòu)復(fù)雜不容易區(qū)分的區(qū)域,進(jìn)一步結(jié)合實(shí)地調(diào)查獲取驗(yàn)證真值。
研究采用文獻(xiàn)[10]提出的經(jīng)典全卷積網(wǎng)絡(luò)模型結(jié)構(gòu),通過與實(shí)際遙感數(shù)據(jù)特征相結(jié)合,構(gòu)建用于建筑區(qū)提取的全卷積網(wǎng)絡(luò)模型,如圖2所示。全卷積網(wǎng)絡(luò)計(jì)算過程主要包括編碼階段和解碼階段兩部分,編碼階段實(shí)現(xiàn)數(shù)據(jù)的壓縮采樣和特征抽取,解碼階段實(shí)現(xiàn)全空間分辨率類別信息的提取。
在編碼階段,主要采用了去除全連接層的VGG-16模型[9]。針對輸入圖像(形狀為3×128×128),經(jīng)過兩次空間卷積和線性整流函數(shù)(Relu)激活,圖像尺寸變?yōu)?4×128×128(卷積層使用補(bǔ)0填充,不改變圖像形狀);然后經(jīng)過一次池化得到pool1(形狀為64×64×64);對pool1進(jìn)行兩次空間卷積、Relu激活和池化,得到pool2(形狀為128×32×32);進(jìn)一步對pool2進(jìn)行三次空間卷積、Relu激活和池化,得到pool3(形狀為256×16×16);對pool3進(jìn)行三次空間卷積、Relu激活和一次池化,得到pool4(形狀為512×8×8);最后對pool4進(jìn)行三次空間卷積、Relu激活和池化,得到pool5(形狀為512×4×4)。至此編碼階段結(jié)束。
在解碼階段,首先將pool5進(jìn)行一次卷積,改變通道大小(圖像形狀變?yōu)?×4×4),之后進(jìn)行一次圖像2倍上采樣得到upsample1(圖像大小變?yōu)?×8×8);將pool4進(jìn)行卷積,改變通道大小(大小變2×8×8),然后與upsample1相加并將結(jié)果進(jìn)行2倍上采樣得到upsample2(形狀為2×16×16);將pool3進(jìn)行卷積,改變通道大小(形狀為2×16×16),然后與upsample2相加并將結(jié)果進(jìn)行8倍上采樣得到upsample3(形狀為2×128×128);最后對upsample3進(jìn)行softmax分類,以某點(diǎn)類別概率最大作為該點(diǎn)類別,得到最終結(jié)果。
由于建筑區(qū)判識主要依賴影像紋理結(jié)構(gòu)特征,同時(shí),為了利用機(jī)器視覺領(lǐng)域大樣本自然圖像進(jìn)行遷移學(xué)習(xí),研究選擇Sentinel-2中RGB波段進(jìn)行試驗(yàn),并將原始波段數(shù)據(jù)進(jìn)行線性拉伸(單景影像全局直方圖上下截?cái)?.05%),得到0—255區(qū)間的真彩色圖像,作為全卷積網(wǎng)絡(luò)輸入數(shù)據(jù)。
試驗(yàn)硬件環(huán)境為:Intel Core i7-5930 CPU、128 GB內(nèi)存、Nvidia GeForce GTX 1080顯卡。軟件環(huán)境為Ubuntu14.4系統(tǒng)Tensorflow1.2平臺和Envi 5.3。
利用高層建筑區(qū)和低層建筑區(qū)樣本分別對本文提出的FCN模型進(jìn)行訓(xùn)練,VGG-16在ImageNet圖像數(shù)據(jù)庫上的預(yù)訓(xùn)練模型參數(shù),優(yōu)化函數(shù)為Adam函數(shù),學(xué)習(xí)率為1E-5,迭代次數(shù)12 000次,將訓(xùn)練后FCN模型對4景試驗(yàn)數(shù)據(jù)進(jìn)行處理。結(jié)合全球30 m DEM數(shù)據(jù),將坡度大于15°區(qū)域作為建設(shè)不適宜區(qū),從提取結(jié)果中進(jìn)行排除,如圖3所示,局部結(jié)果見表1。
類型Test_1Test_2Test_3Test_4Test_5Test_6Test_7Test_8驗(yàn)證區(qū)Sentinel-2影像驗(yàn)證區(qū)高分影像圖高層建筑區(qū)高值圖FCN高層提取結(jié)果GL-ED高層提取結(jié)果低層建筑區(qū)真值圖FCN低層提取結(jié)果GL-ED低層提取結(jié)果
利用相同樣本并參照文獻(xiàn)[6]中經(jīng)驗(yàn)參數(shù)對紋理結(jié)構(gòu)方法(GL-ED法)進(jìn)行試驗(yàn)。將RGB波段均值作為輸入,分別計(jì)算Mean、Variance、Homogeneity、Contrast、Dissimilarity、Entropy、Second Moment、Correlation 8個灰度共生矩陣特征(窗口大小5×5,方向?yàn)槟J(rèn)135°)。將紋理特征進(jìn)行主成分分析,選取前5個主成分與邊緣密度特征相結(jié)合進(jìn)行最大似然分類,提取試驗(yàn)區(qū)內(nèi)高層與低層建筑區(qū),并排除不適宜建設(shè)區(qū)域(局部見表1)。
本文采用定性和定量兩種方法對提取結(jié)果進(jìn)行精度評定。首先將FCN法和GL-ED法提取的高層建筑區(qū)和低層建筑區(qū)結(jié)果,按照驗(yàn)證樣區(qū)進(jìn)行裁剪,得到各驗(yàn)證樣區(qū)提取結(jié)果,見表1。
結(jié)合表1中驗(yàn)證真值進(jìn)行定性判讀分析可知,高層建筑區(qū)整體較少,分布較為稀疏,F(xiàn)CN法提取高層結(jié)果較為接近真值;而GL-ED法提取結(jié)果不符合驗(yàn)證區(qū)高層建筑真實(shí)分布,尤其是對于驗(yàn)證區(qū)8(Test_8),該區(qū)域?yàn)榈湫痛迓涫饺丝诰劬訁^(qū),不存在任何高層建筑,但GL-ED仍提取出較多高層建筑,結(jié)果誤差較大。對于低層建筑區(qū),F(xiàn)CN提取結(jié)果同樣符合驗(yàn)證區(qū)域真實(shí)建筑分布,提取結(jié)果輪廓和位置都比較準(zhǔn)確;而GL-ED提取結(jié)果較為散碎,提取結(jié)果在位置上比較準(zhǔn)確,但內(nèi)部細(xì)節(jié)失真很大。
利用驗(yàn)證真值數(shù)據(jù),以基于像元個數(shù)統(tǒng)計(jì)的精度為指標(biāo),對8個驗(yàn)證樣區(qū)提取結(jié)果進(jìn)行精度定量評價(jià),計(jì)算公式如下
精度=正確像元個數(shù)/整體像元個數(shù)
結(jié)果表明,整體建筑區(qū)提取平均精度為95.30%。其中FCN法提取的高層建筑區(qū)的最小精度為98.75%,平均精度達(dá)到99.22%;FCN法提取的低層建筑區(qū)的精度最低為88.57%,平均達(dá)到91.38%。而GL-ED法提取結(jié)果精度整體明顯低于FCN法提取結(jié)果,平均相差20%左右。同時(shí),在8個驗(yàn)證樣區(qū)上,GL-ED法提取結(jié)果波動較大,表明FCN法應(yīng)用于高低層建筑區(qū)提取具有較高準(zhǔn)確性和穩(wěn)定性。
對FCN法提取結(jié)果進(jìn)行統(tǒng)計(jì),研究區(qū)內(nèi)高層建筑區(qū)約占地94 km2,低層建筑區(qū)約占地7351 km2。高層建筑區(qū)整體較少,重點(diǎn)集中于保定市城區(qū)、廊坊市城區(qū)、固安縣北部與北京大興交接處、武清區(qū)、定州市城區(qū)等地。低層建筑區(qū)除了研究區(qū)西北部易縣、淶水縣、淶源縣等地處山區(qū)分布相對較少外,其他區(qū)域分布十分密集,主要體現(xiàn)出兩個特點(diǎn):一是與鄉(xiāng)村居民點(diǎn)分布高度相關(guān),二是在城鎮(zhèn)區(qū)域分布較為集中,如保定市區(qū)、廊坊市區(qū)。雄安新區(qū)中心安新、雄縣和容城三縣內(nèi)高層建筑區(qū)約1.25 km2,低層建筑區(qū)約312.24 km2。其中高層建筑區(qū)主要分布在縣城城區(qū),低層建筑區(qū)主要分布在安新、雄縣和容城縣城城區(qū),以及在人口聚居較多的鄉(xiāng)鎮(zhèn)。
本文面向Sentinel-2數(shù)據(jù),提出了一種基于全卷積深度網(wǎng)絡(luò)的高低層建筑區(qū)提取方法,并結(jié)合雄安新區(qū)及其周邊4幅Sentinel-2數(shù)據(jù)進(jìn)行了試驗(yàn)分析,對比了經(jīng)典的紋理結(jié)構(gòu)算法。結(jié)果表明,基于全卷積網(wǎng)絡(luò)的方法具有提取效率高、準(zhǔn)確度高等優(yōu)點(diǎn),在Sentinel-2遙感影像高低層建筑區(qū)提取中有很好的表現(xiàn),相對于紋理算法結(jié)構(gòu)更適合大范圍中高分辨率遙感影像建筑區(qū)提取。
本文方法可以結(jié)合Sentinel-2數(shù)據(jù)大幅寬和高頻次的觀測特點(diǎn),以及更多類型建筑區(qū)樣本,實(shí)現(xiàn)大范圍地表多類型建筑區(qū)的動態(tài)高效監(jiān)測。