潘建平,李明明,孫博文,李鑫,胡勇
(1.重慶交通大學(xué) 土木工程學(xué)院,重慶 400074;2.重慶市規(guī)劃和自然資源調(diào)查監(jiān)測院,重慶 401123)
城市新增建設(shè)用地是城市建設(shè)的重要組成部分,其準(zhǔn)確提取對制定科學(xué)合理的城市規(guī)劃與土地利用規(guī)劃、合理利用城市土地資源,促進城市土地集約節(jié)約利用,提高城市土地利用具有重要意義[1]。隨著遙感技術(shù)的快速發(fā)展,使得高分辨遙感影像實現(xiàn)對地表覆蓋變化檢測成為一種高效、準(zhǔn)確的技術(shù)手段[2]。近些年,國內(nèi)外學(xué)者在遙感影像變化檢測中做了大量的研究,常用的方法有分類后比較法[3]、影像代數(shù)法[4]、變化向量分析法[5]及基于形狀特征的變化檢測方法[6]等,但是普遍存在影像預(yù)處理環(huán)節(jié)要求嚴格、部分環(huán)節(jié)需要人工干預(yù),自動化程度低、難以處理多源數(shù)據(jù)等缺點[7]。
與常用的變化檢測方法相比,深度學(xué)習(xí)算法具有極強的學(xué)習(xí)能力,能夠擬合復(fù)雜的映射關(guān)系,解決復(fù)雜的任務(wù)場景[8],因此可以將深度學(xué)習(xí)算法引入遙感領(lǐng)域,利用深度神經(jīng)網(wǎng)絡(luò)強大的特征學(xué)習(xí)能力來解決復(fù)雜的遙感影像變化檢測問題[9]。2010年Mnih等[10]首次將深度學(xué)習(xí)方法引入遙感領(lǐng)域,提出用DBN(deep belief networks)模型來檢測機載遙感圖像中的道路。2015年戴丹[11]使用BP神經(jīng)網(wǎng)絡(luò)對長沙市城市建設(shè)用地擴張規(guī)模進行預(yù)測研究。2016年Zhang等[12]采用去噪編碼器進行多源遙感影像的變化檢測,變化檢測的精度高于傳統(tǒng)的變化檢測方法。2017年馮麗英[13]采用深度學(xué)習(xí)對城市建設(shè)用地信息進行提取,證明了深度卷積神經(jīng)網(wǎng)絡(luò)在分類精度上優(yōu)于傳統(tǒng)的分類器。2017年Xie等[14]提出了新的殘差ResNeXt模型,并將這種模型與ResNet進行比較,證明了ResNeXt訓(xùn)練錯誤率更低、提取精度更高。2019年高峰等[15]采用deeplab語義分割網(wǎng)絡(luò)實現(xiàn)了耕地資源的自動化提取與變化檢測。2019年吳海平等[16]利用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)自動提取新增建筑用地信息,實現(xiàn)了深度學(xué)習(xí)技術(shù)在土地利用遙感監(jiān)測方面的初步探索。
目前,采用深度學(xué)習(xí)進行城市新增建設(shè)用地的變化檢測研究尚少,同時國內(nèi)外沒有開放的數(shù)據(jù)集,給新增建設(shè)用地變化檢測工作帶來諸多困難。為此文章通過人工標(biāo)注遙感影像,解決了缺少數(shù)據(jù)集的問題,并研發(fā)了一種改進U-Net的城市新增建設(shè)用地高分遙感變化檢測技術(shù),改進后的U-Net既保留了U-Net跳躍連接和編碼、解碼結(jié)構(gòu)的特點,又引入殘差網(wǎng)絡(luò)ResNeXt解決了網(wǎng)絡(luò)深度加深帶來的模型退化問題。
以全國土地變更調(diào)查遙感監(jiān)測的DOM成果為數(shù)據(jù)源,其中前時相影像數(shù)據(jù)為2010年WorldView2數(shù)據(jù),后時相遙感影像數(shù)據(jù)為2011年QuickBird+WorldView1的鑲嵌數(shù)據(jù),分辨率均為0.5 m。改進U-Net的城市新增建設(shè)用地高分遙感變化檢測流程如圖1所示。
圖1 城市新增建設(shè)用地變化檢測流程
城市建設(shè)用地是城市土地的重要組成部分,從廣義上講是城市管轄范圍內(nèi)所有用于建設(shè)的土地,從狹義上講是城市規(guī)劃區(qū)范圍內(nèi)根據(jù)城市規(guī)劃確定進行開發(fā)的土地。由于遙感地物種類復(fù)雜多樣,不同種類之間相互組合,可以判定為新增的變化眾多,給數(shù)據(jù)集的制作帶來了困難。通過借鑒《2020年度全國國土利用遙感監(jiān)測圖斑類型劃分標(biāo)準(zhǔn)》[17],結(jié)合重慶市的新增建設(shè)用地實際情況,本文對新增建設(shè)用地的界定根據(jù)下面四個標(biāo)準(zhǔn):(1)前時相影像有植被覆蓋或明顯非建設(shè)痕跡,后時相影像有明顯建設(shè)特征;(2)前時相影像有植被覆蓋或明顯非建設(shè)痕跡,后時相影像有明顯建設(shè)推填土特征;(3)前時相影像有明顯建設(shè)推填土特征,后時相影像有明顯建設(shè)特征;(4)前時相影像有植被覆蓋或沒有明顯建設(shè),后時相影像有明顯道路或大型溝渠特征。
首先,對前后期影像進行地理配準(zhǔn),保證兩期影像中同名地物的特征點相互匹配。再將兩幅影像分別矢量化,按照城市新增建設(shè)用地類型界定的四個標(biāo)準(zhǔn),提取出新增建設(shè)用地的矢量圖斑區(qū)域,并通過標(biāo)注工具轉(zhuǎn)化為二值標(biāo)簽圖,即只含有新增建設(shè)用地與未變化用地兩個標(biāo)簽。然后將前期影像、后期影像、標(biāo)簽圖按照128的步長裁減為256×256的數(shù)據(jù)。數(shù)據(jù)集按照9∶1的比例劃分為訓(xùn)練集、驗證集,并通過隨機旋轉(zhuǎn)、上下翻轉(zhuǎn)、左右翻轉(zhuǎn)三種增廣方法將訓(xùn)練集擴大為原來的四倍。最后將裁減后的3波段前期影像、后期影像批量疊加為6波段的影像與標(biāo)簽一起輸入網(wǎng)絡(luò)中進行訓(xùn)練。
首先,將樣本集輸入改進前的U-Net中,在保證所有參數(shù)不變的情況下,僅改變?nèi)N損失函數(shù)的設(shè)置進行分別訓(xùn)練,通過對比分析損失曲線圖、驗證集預(yù)測結(jié)果圖來尋找其中最優(yōu)的損失函數(shù),并將該損失函數(shù)設(shè)置為改進后網(wǎng)絡(luò)的損失函數(shù)。其次,將樣本集輸入改進后的網(wǎng)絡(luò)中進行訓(xùn)練和預(yù)測,并將預(yù)測結(jié)果與人工真實標(biāo)注結(jié)果進行精度評定。
采用二分類問題中常見的評價指標(biāo):精確率(precision)、召回率(recall)、F1分數(shù)(是精確率和召回率的調(diào)和均值)。
損失函數(shù)是用來估量模型預(yù)測值與真實值不一致程度,損失值越小,模型的魯棒性就越好,選取一個好的損失函數(shù)對于模型至關(guān)重要。但是在新增建設(shè)用地變化檢測中存在類別不平衡的現(xiàn)象,即未變化的類別數(shù)量往往大于發(fā)生變化的類別數(shù)量,這將導(dǎo)致訓(xùn)練時損失函數(shù)會偏向樣本數(shù)量多的一方,造成訓(xùn)練時損失函數(shù)很小,反而對發(fā)生變化類別的識別精度不高。針對這種現(xiàn)象,選擇了三種針對類別非均衡的損失函數(shù)進行對比,分別是dice loss、focal loss和WCE loss(weight crossentropy loss),找尋其中最優(yōu)的損失函數(shù)來提高精度。
dice loss是比較兩個樣本的相似程度,是一個區(qū)域相關(guān)的loss。當(dāng)前像素的loss不僅和當(dāng)前像素的預(yù)測值相關(guān),和其他點的值也相關(guān),訓(xùn)練更傾向于挖掘前景區(qū)域,正負樣本不平衡的情況就是前景占比較小。
focal loss的提出是在目標(biāo)檢測領(lǐng)域,為了解決正負樣本比例嚴重失調(diào)的問題。首先在原有的基礎(chǔ)上加了一個因子gamma,減少易分類樣本的損失,使得更關(guān)注于困難的、錯分的樣本。加入平衡因子alpha,用來平衡正負樣本本身的比例不均。
WCE loss是給正樣本加上一定的權(quán)重,來解決類別不平衡的現(xiàn)象。
U-Net采用了一種編碼器解碼器的結(jié)構(gòu),淺層的網(wǎng)絡(luò)用來解決像素定位的問題,而深層次的網(wǎng)絡(luò)用來解決像素分類的問題。添加的上采樣階段可以擴大特征通道,允許網(wǎng)絡(luò)保留更多的原圖信息在高分辨率的網(wǎng)絡(luò)層次傳播。沒有使用全連接,全程使用valid來卷積保證了分割結(jié)果是基于沒有缺失的全部特征。采用一種對稱結(jié)構(gòu)連接到所有淺層特征,將所有提取到的特征加以利用,保證了輸入與輸出尺寸相同的同時,也進一步提升了分割效果。這些結(jié)構(gòu)使得U-Net可以使用比較少的訓(xùn)練集就可以得到非常好的分割效果。
殘差網(wǎng)絡(luò)ResNeXt是在inception與ResNet上做出的改進,在結(jié)構(gòu)上有兩個特點。首先,借鑒了inception的“分割-轉(zhuǎn)換-合并”模式,先將輸入通道進行分組,然后對每一組進行卷積運算,最后再把所有分組的結(jié)果融合。其次,繼承了ResNet的重復(fù)層策略,但不同的是,增加了路徑的數(shù)量,每個路徑上使用相同的拓撲結(jié)構(gòu)組建ResNeXt模塊分組卷積。這種獨特的結(jié)構(gòu)使得殘差網(wǎng)絡(luò)ResNeXt可以在不增加參數(shù)復(fù)雜度的前提下提高準(zhǔn)確率,同時相同的拓撲結(jié)構(gòu)減少了超參數(shù)的數(shù)量,便于模型移植。其結(jié)構(gòu)如圖2所示。
為了增加網(wǎng)絡(luò)分割結(jié)果的精細程度,增加特征的表達能力,同時避免層數(shù)加深帶來的模型退化問題,文章采用了ResNeXt 50來對U-Net的編碼層進行改進,以瓶頸殘差模塊對卷積層進行替換,分別以3、4、6、3個bottleneck_block堆疊塊對U-Net的第2、3、4、5層中的卷積進行替代,其中ResNeXt50網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖3所示。改進后的網(wǎng)絡(luò)結(jié)構(gòu)如圖4所示。
圖3 ResneXt50網(wǎng)絡(luò)結(jié)構(gòu)示意圖
圖4 基于ResNeXt50的改進U-Net示意圖
本文使用Tensorflow框架并在NVIDIA GeForce RTX 2080 Ti上完成訓(xùn)練與測試。其中訓(xùn)練集增廣后為7 776組,驗證集未增廣為216組,訓(xùn)練集的作用是對神經(jīng)網(wǎng)絡(luò)參數(shù)進行更新調(diào)優(yōu),驗證集的作用是驗證神經(jīng)網(wǎng)絡(luò)的預(yù)測精度,并不參與參數(shù)更新。訓(xùn)練集中每8組樣本為一批次輸入神經(jīng)網(wǎng)絡(luò),迭代次數(shù)設(shè)置為500,優(yōu)化器為帶動量的隨機梯度下降法,其中學(xué)習(xí)率設(shè)置為0.001,權(quán)重衰減為1E-6,動量為0.9。
在同一個U-Net中僅改變?nèi)N損失函數(shù)的設(shè)置,分別進行訓(xùn)練,生成訓(xùn)練模型,并對驗證集進行預(yù)測與精度評定,訓(xùn)練時的精度如圖5所示,預(yù)測結(jié)果為圖6中的第2、3、4列所示。通過對比發(fā)現(xiàn),加權(quán)交叉熵函數(shù)在基于U-Net的新增建設(shè)用地檢測中結(jié)果最好。因此將交叉熵設(shè)置為殘差U-Net的損失函數(shù),保證上述訓(xùn)練參數(shù)不變的情況下,生成訓(xùn)練模型,并對驗證集進行預(yù)測與精度評定,訓(xùn)練結(jié)果為圖6中的第5列。
注:橘色曲線為加權(quán)交叉熵損失函數(shù);紅色曲線為dice損失函數(shù);藍色為focal損失函數(shù);橫坐標(biāo)為迭代次數(shù);豎坐標(biāo)為訓(xùn)練精度。
注:第1列圖片為人工勾畫的真實變化圖,紅色區(qū)域為新增建設(shè)用地區(qū)域,黑色區(qū)域為未變化區(qū)域。第2、3、4、5列是預(yù)測的結(jié)果圖,白色區(qū)域是預(yù)測為新增建設(shè)用地的區(qū)域,黑色是預(yù)測為沒有發(fā)生變化的區(qū)域。其中第2、3、4列是采用相同的U-Net,基于不同損失函數(shù)的預(yù)測結(jié)果圖,損失函數(shù)分別為 focal函數(shù)、dice函數(shù)、交叉熵函數(shù)。第5列是采用殘差網(wǎng)絡(luò)對U-Net改進后的網(wǎng)絡(luò)預(yù)測結(jié)果圖,損失函數(shù)設(shè)置的是交叉熵函數(shù)。
從圖5可以看出,加權(quán)交叉熵函數(shù)在三種損失函數(shù)中精度的最高。從圖6也可以看出,加權(quán)交叉熵函數(shù)較前兩種損失函數(shù)在驗證集上提取的邊界輪廓更加完整,提取準(zhǔn)確率也更高。所以可以認為,加權(quán)交叉熵函數(shù)在采用U-Net進行城市新增建設(shè)用地的變化檢測中效果最好。從圖6中第4、5列可以看出,改進后的網(wǎng)絡(luò)相比于未改進前提取效果更顯著,減少了分割圖形中噪聲點的出現(xiàn),提取邊緣輪廓更趨近真實標(biāo)簽圖。
由于本文的研究目標(biāo)是為了提取出城市建設(shè)用地的新增區(qū)域,而不是對四種類型的變化進行分類研究,可以直接使用訓(xùn)練好的模型對實驗區(qū)進行預(yù)測,而無需考慮不同新增建設(shè)用地的形態(tài)差異。
選取茶園區(qū)變化明顯且包含所有新增用地種類的典型地區(qū)作為實驗區(qū),前后期影像大小為3 253像素×2 665像素,面積為2.167 km2,分辨率均為0.5 m,該實驗區(qū)與訓(xùn)練集、樣本集無重復(fù)區(qū)域,其中前后原始影像如圖7所示,人工標(biāo)注真實變化區(qū)域及改進模型預(yù)測結(jié)果如圖8所示。提取精度對比如表1所示。
圖7 茶園區(qū)部分地區(qū)
圖8 結(jié)果對比
表1 精度對比 %
從表1可以看出,加權(quán)交叉熵在三種損失函數(shù)中的綜合值F1分數(shù)值最高,為85.056%,優(yōu)化改進的網(wǎng)絡(luò)F1分數(shù)高于未改進的U-Net,提高了2.546%。實驗結(jié)果證明了優(yōu)化和改進網(wǎng)絡(luò)的有效性和必要性。
本文考慮U-Net結(jié)構(gòu)在變化檢測方面強大的提取能力,通過在U-Net基礎(chǔ)上加入殘差進行改進,制定重慶市特有的城市新增建設(shè)用地數(shù)據(jù)集,設(shè)計了一套完整的基于深度學(xué)習(xí)方法的城市新增建設(shè)變化檢測流程。實驗結(jié)論主要有以下幾點。
通過三種損失函數(shù)在訓(xùn)練精度曲線和提取結(jié)果的對比,找尋最優(yōu)的損失函數(shù),來盡可能減少類別不平衡對提取精度的影響。實驗結(jié)果表明,加權(quán)交叉熵函數(shù)在三種函數(shù)中的精度最高,同時驗證集上提取的邊界輪廓更加完整,提取準(zhǔn)確率也更高,實現(xiàn)了U-Net在損失函數(shù)上的優(yōu)化。
殘差網(wǎng)絡(luò)ResNeXt已經(jīng)被證明比ResNet具有更好的效果。為了避免一味地網(wǎng)絡(luò)加深而帶來的模型退化現(xiàn)象,本文借鑒了ResNeXt 50結(jié)構(gòu)的殘差模塊對U-Net的編碼結(jié)構(gòu)中卷積層進行替換,在加深了網(wǎng)絡(luò)的深度來獲取更高提取精度的同時,這種獨特的結(jié)構(gòu)也可以避免模型退化的問題。實驗結(jié)果表明,改進后的網(wǎng)絡(luò)相比未改進前在使用同一種損失函數(shù)和參數(shù)時提取精度更高,證明了加入殘差網(wǎng)絡(luò)的有效性。
文章在U-Net上進行了優(yōu)化和改進,為城市新增建設(shè)用地的變化檢測提供了一種好的方法與思路,可以解決傳統(tǒng)檢測方法的工作量大、提取精度低、特征選擇困難、閾值設(shè)置難等問題。但由于數(shù)據(jù)源僅選擇了重慶茶園區(qū)的數(shù)據(jù),所以數(shù)據(jù)集所包含的地物類別不夠全面復(fù)雜,對其他地區(qū)的城市新增建設(shè)用地的提取效果還有待考證,下一步將在擴大樣本集的數(shù)據(jù)量和復(fù)雜度方面繼續(xù)研究。