陳磊士,趙俊三,董智文,朱褀夫
(1.昆明理工大學(xué) 國(guó)土資源工程學(xué)院,云南 昆明 650500;2.北京長(zhǎng)地萬方科技有限公司佛山分公司,廣東 佛山 528305)
城市建設(shè)用地信息提取是進(jìn)行城市開發(fā)利用和環(huán)境變化研究的一項(xiàng)重要數(shù)據(jù)來源,為城市規(guī)劃管理工作提供數(shù)據(jù)參考。近年來我國(guó)城市快速發(fā)展,城市建設(shè)用地信息變化呈現(xiàn)出范圍廣、速度快的特點(diǎn),而多光譜遙感因具有快速獲取空間連續(xù)和觀測(cè)持續(xù)的影像數(shù)據(jù)能力,成為快速獲取城市建設(shè)用地信息的重要方法[1],國(guó)內(nèi)外已有大量取得了較好效果的相關(guān)研究。為了進(jìn)一步提高遙感影像圖精度,深度學(xué)習(xí)技術(shù)逐漸在信息提取、遙感影像分類、變化監(jiān)測(cè)等領(lǐng)域廣泛應(yīng)用。但基于深度學(xué)習(xí)技術(shù)的影像分類應(yīng)用目前較少,劉亞丹[2]在遙感影像分類任務(wù)上的嘗試較具有代表性。與以支持向量機(jī)為例的傳統(tǒng)方法相比,深度學(xué)習(xí)技術(shù)在影像空間分布規(guī)律上的挖掘精度更加準(zhǔn)確,高常鑫[3]等通過分層方法建立深度學(xué)習(xí)模型,完成了對(duì)影像的高精度分類;張?chǎng)锡圼4]等通過提取變化和未變化區(qū)域深層特征有效辨別變化區(qū)域,闞希[5]等利用多光譜衛(wèi)星遙感和深度學(xué)習(xí)方法進(jìn)行青藏高原積雪判識(shí)研究,取得了較好結(jié)果;鮑江峰[6]將深度置信網(wǎng)絡(luò)應(yīng)用于探測(cè)墨西哥灣溢油區(qū)域情況。而在西南地區(qū)高原山地城市應(yīng)用深度學(xué)習(xí)進(jìn)行多光譜遙感影像快速提取城市建設(shè)用地信息的研究較為鮮見。
機(jī)器學(xué)習(xí)是人工智能的核心,隨著當(dāng)前機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,深度學(xué)習(xí)模型憑借多隱層結(jié)構(gòu)優(yōu)勢(shì),被廣泛應(yīng)用于多個(gè)領(lǐng)域。卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network, CNN)是前饋神經(jīng)網(wǎng)絡(luò)的一種,其特點(diǎn)包括:局部感知域、權(quán)值共享域和池化,對(duì)于影像的提取分類有明顯優(yōu)勢(shì),其層次多、容量大的優(yōu)點(diǎn)滿足了影像分類中對(duì)大量數(shù)據(jù)處理的需要,近年來在遙感影像分類處理領(lǐng)域取得了很好的成果[7]。本文分別對(duì)Landsat8 OLI_TIRS遙感影像使用深度卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行城市建設(shè)用地分類提取處理,使用BP神經(jīng)網(wǎng)絡(luò)作為對(duì)照實(shí)驗(yàn)組,按照對(duì)象個(gè)數(shù)、對(duì)象面積和地表覆被吻合度3種提取精度評(píng)價(jià)指數(shù)對(duì)分類結(jié)果進(jìn)行評(píng)價(jià)分析[8]。
曲靖是云南省下轄地級(jí)市,位于云南省東部,與貴州省、廣西壯族自治區(qū)毗鄰,有“云南咽喉”之稱。國(guó)土總面積2.89萬km2,地跨東經(jīng)102°42′-104°50′,北緯24°19′-27°03′???cè)丝?34萬人。世居漢、彝、回、壯、布依、苗、水、瑤等8個(gè)主體民族,其中少數(shù)民族49.03萬人。是云南省僅次于昆明的重要工商業(yè)城市,也是省區(qū)域中心城市和第二大綜合性城市。境內(nèi)土壤類型從赤紅壤到亞高山草甸土均有分布,土壤地理分布具有明顯的垂直帶和一定的水平差距,自1971-2000年間的日平均氣溫為14.4℃,年平均降水985.8mm,全市屬于低緯度地區(qū)高原山地季風(fēng)性氣候[9]。
曲靖市主城區(qū)概況如圖1所示,其東與富源縣接壤,南與羅平縣、陸良縣毗鄰,西與馬龍縣交界,北與沾益區(qū)相連,根據(jù)云南省第二次土地調(diào)查結(jié)果顯示,主城區(qū)總面積為1 201.01km2,截至2013年底人口達(dá)到100萬人,近年來隨著城市的快速發(fā)展,建成區(qū)范圍擴(kuò)展迅速,對(duì)城市建設(shè)用地信息快速提取的需求持續(xù)加大。其主城區(qū)由9部分組成:麒麟?yún)^(qū)南寧街道、建寧街道、寥廓街道、白石江街道、三寶街道、珠街街道、沿江街道、西城街道和馬龍縣通泉鎮(zhèn)及沾益縣西平鎮(zhèn)。
圖1 研究區(qū)概況
本研究采用的數(shù)據(jù)源包括:2015年11月20日的Landsat8 OLI_TIRS遙感影像,數(shù)據(jù)標(biāo)識(shí)碼為L(zhǎng)C81290422015324LGN00,分辨率為30m,接收站LGN,中心經(jīng)度103.457,太陽(yáng)高度角40.74°,太陽(yáng)方位角155.83°,條帶號(hào)129,行編號(hào)42。輔助數(shù)據(jù)包括:曲靖市主城區(qū)矢量范圍線,用于研究區(qū)范圍劃定;曲靖市土地利用現(xiàn)狀圖(2015年)及野外調(diào)研資料,用于地類提取過程中樣本選取與精度評(píng)定;SRTM.V4曲靖市30m精度DEM數(shù)據(jù),用于影像地形校正。
使用FLAASH大氣校正工具,F(xiàn)LAASH模塊能夠精確補(bǔ)償大氣影像,導(dǎo)入Landsat8影像數(shù)據(jù)配套MLT文件相關(guān)參數(shù),輻射率單位調(diào)整系數(shù)設(shè)定為0.1,大氣模型參數(shù)則按照氣候模型設(shè)定[10]。
對(duì)數(shù)據(jù)進(jìn)行地形校正地理編碼(GTC),配合已有的SRTM.V4曲靖市30m精度DEM數(shù)據(jù),與地理坐標(biāo)系建立映射關(guān)系后進(jìn)行地形校正。選擇C模型法校正地形,C模型是一種應(yīng)用半經(jīng)驗(yàn)系數(shù)C的基于余弦校正的模型[11],其公式為:
(1)
其中,LH代表校正后像素輻射量度,LT代表校正前像素輻射量度;θs為太陽(yáng)天頂角,i為太陽(yáng)有效入射角;c為半經(jīng)驗(yàn)系數(shù),無明確物理含義。
選擇ENVI軟件中提供的二次多項(xiàng)式法為幾何校正方法,將誤差控制在0.5個(gè)像元之內(nèi),完成遙感影像預(yù)處理過程[12]。
經(jīng)典卷積神經(jīng)網(wǎng)絡(luò)主要組成部分包括輸入層、卷積層、池化層、全連接層和輸出層5個(gè)部分[13]。卷積神經(jīng)網(wǎng)絡(luò)模型的運(yùn)算通常為先輸入原始圖像X,再通過卷積層得到特征圖,本文用Hi表示卷積神經(jīng)網(wǎng)絡(luò)第i層的特征圖(H0=X)。設(shè)Hi為卷積層,則Hi特征圖產(chǎn)生過程如式(2)所示。
Hi=f(Hi-1?Wi+bi)
(2)
其中,Wi為第i層卷積核權(quán)值向量,運(yùn)算符號(hào)“?”代表第i-1層圖像或者特征圖與卷積核進(jìn)行的一系列卷積操作,卷積操作后得到圖形,與第i層的偏移向量bi相加,最后使用非線性激勵(lì)函數(shù)f(x)進(jìn)行非線性計(jì)算,得到第i層特征圖。
卷積層之后與之相連的通常是池化層,將特征圖根據(jù)一定的池化規(guī)則進(jìn)行池化[7]。池化層主要是將特征圖進(jìn)行降維的同時(shí),在一定程度上維持特征的尺度不變特性。池化層工作原理如式(3)所示。
Hi=subsampling(Hi-1)
(3)
在通過多個(gè)池化層和卷積層的相互傳遞后,卷積神經(jīng)網(wǎng)絡(luò)模型通過全連接網(wǎng)絡(luò)對(duì)目標(biāo)對(duì)象特征進(jìn)行針對(duì)性提取和分類,基于輸入對(duì)象得到概率分布Y(li表示第i個(gè)標(biāo)簽類別)[8]。如式(4)所示,卷積神經(jīng)網(wǎng)絡(luò)的本質(zhì)是基于特征尺度不變特性的前提下,將原始矩陣(H0)經(jīng)過降維,在多層次的數(shù)據(jù)變換后,映射到一個(gè)新的特征表達(dá)(Y)數(shù)學(xué)模型中。
Y(i)=P(L=li|H0;W,b))
(4)
卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練目的是將網(wǎng)絡(luò)損失函數(shù)L最小化。輸入H0進(jìn)行前向傳導(dǎo),再通過損失函數(shù)計(jì)算出目標(biāo)與期望值之間的殘差。常見損失函數(shù)有均方誤差(Mean Squared Error, MSE)函數(shù)和負(fù)對(duì)數(shù)似(Negative Log Likelihood, NLL)函數(shù)[8],如式(5)、式(6)所示。
(5)
(6)
最終,損失函數(shù)通常通過增加L2減輕過擬合問題,通過參數(shù)λ(weight decay)控制過擬合作用的強(qiáng)度,通過范數(shù)控制權(quán)值的過擬合[9],如式(7)所示。
(7)
卷積神經(jīng)網(wǎng)絡(luò)通常使用梯度下降方法作為訓(xùn)練的優(yōu)化方法。殘差經(jīng)過梯度下降進(jìn)行反向傳播,進(jìn)而逐層更新卷積神經(jīng)網(wǎng)絡(luò)的每層可訓(xùn)練參數(shù)(W和b)。其中學(xué)習(xí)速率參數(shù)(η)控制殘差梯度下降時(shí)反向傳播的強(qiáng)度[14],如式(8)、式(9)所示。
(8)
(9)
20世紀(jì)90年代,LeCun等在傳統(tǒng)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上引入了卷積核池化概念,首次提出了卷積神經(jīng)網(wǎng)絡(luò),其基本結(jié)構(gòu)由輸入層、卷積層、池化層、全連接層、分類層和輸出層構(gòu)成。在具體的應(yīng)用中池化層和卷積層的參數(shù)、層數(shù)及全連接運(yùn)層類器類型可隨之改變,其基本原理[15]如圖2所示。
圖2 卷積神經(jīng)網(wǎng)絡(luò)基本原理
(1)輸入層。輸入一幅大小規(guī)范的二維圖像。
(2)卷積層。通過卷積處理將輸入的圖像分為4個(gè)特征圖。
(3)池化層。將C1層中得到的毎一個(gè)特征圖相鄰局部區(qū)域進(jìn)行加權(quán)運(yùn)算,再乘以—個(gè)乘子偏差,加上一個(gè)附加偏差,最后通過一個(gè)激勵(lì)函數(shù)在下采樣層S1得到4個(gè)特征圖,池化層計(jì)算公式如式(10)所示。
(10)
(4)重復(fù)(2)、(3)后得到C2和S2層,使特征圖通過不斷卷積和池化處理縮小,直到最后一次卷積得到一維數(shù)據(jù)。
(5)通過一系列的卷積和池化后,在最后一層一維池化層后加入特定的分類器進(jìn)行數(shù)據(jù)識(shí)別分類。
為驗(yàn)證卷積神經(jīng)網(wǎng)絡(luò)的精度,本文基于深度學(xué)習(xí)框架MXNet系統(tǒng),以GoogleNet Inception V3為分類器,并以常用的BP神經(jīng)網(wǎng)絡(luò)作為對(duì)比方法,對(duì)圖像標(biāo)準(zhǔn)化處理后,輸入不同網(wǎng)絡(luò)模型進(jìn)行訓(xùn)練、驗(yàn)證和預(yù)測(cè),比較兩種不同提取方法的提取效果,兩種提取方法的影像數(shù)量統(tǒng)計(jì)如表1所示。
在模型訓(xùn)練過程中,為了控制殘差反向傳播及網(wǎng)絡(luò)穩(wěn)定性,設(shè)置學(xué)習(xí)率初始值為0.01,根據(jù)不同提取方法對(duì)應(yīng)調(diào)整每一批訓(xùn)練樣本的批大小(batch size),對(duì)以標(biāo)準(zhǔn)化方式處理后的區(qū)域多邊形影像對(duì)象分別進(jìn)行30次訓(xùn)練,并記錄其提取精度[16]。
表1 不同提取方法下對(duì)象數(shù)目統(tǒng)計(jì)
使用卷積神經(jīng)網(wǎng)絡(luò)提取的曲靖市主城區(qū)建筑用地范圍如圖3所示,為了評(píng)價(jià)卷積神經(jīng)網(wǎng)絡(luò)對(duì)城市建設(shè)用地信息遙感影像的提取能力,本文提取了BP神經(jīng)網(wǎng)絡(luò)對(duì)研究區(qū)域進(jìn)行城市建設(shè)用地作為卷積神經(jīng)網(wǎng)絡(luò)的對(duì)照組[17],在提取過程中,影像預(yù)處理階段采用與卷積神經(jīng)網(wǎng)絡(luò)相同的參數(shù)設(shè)置[18],在分類器訓(xùn)練和提取階段均采用相同的參數(shù)設(shè)置。兩種提取方法下建設(shè)用地信息提取的精度對(duì)比如表2所示,在對(duì)象個(gè)數(shù)、對(duì)象面積和地表覆被吻合度提取精度的評(píng)價(jià)方法中,卷積神經(jīng)網(wǎng)絡(luò)的提取精度達(dá)到92.99%、94.78%和89.64%,遠(yuǎn)高于常用的BP神經(jīng)網(wǎng)絡(luò)提取精度:75.42%、80.76%和78.97%,證明卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于實(shí)驗(yàn)區(qū)城市建設(shè)用地取得了較高的提取精度。
表2 不同提取方法下提取精度對(duì)比
由此可知,根據(jù)不同的精度評(píng)價(jià)方法,卷積神經(jīng)網(wǎng)絡(luò)的提取精度在道路信息提取和其它建筑用地提取上精度明顯高于BP神經(jīng)網(wǎng)絡(luò)法。如圖4所示,在圖像細(xì)節(jié)特征分類提取中,尤其在城市道路的提取上,卷積神經(jīng)網(wǎng)絡(luò)法相比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)法,其精度有了顯著提高。因此無論是在數(shù)據(jù)上還是在效果圖上,均表現(xiàn)卷積神經(jīng)網(wǎng)絡(luò)法在滇中城市多光譜影像建設(shè)用地提取研究中體現(xiàn)了較高的提取精度。
圖3 使用卷積神經(jīng)網(wǎng)絡(luò)的曲靖市主城區(qū)建筑用地提取
圖4 建筑用地提取影像提取精度局部對(duì)比
經(jīng)過實(shí)驗(yàn)可知,相比于以卷積神經(jīng)網(wǎng)絡(luò)模型為代表的深度學(xué)習(xí)城市建設(shè)用地提取方法,傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)在訓(xùn)練樣本較少時(shí)能取得一定效果,但當(dāng)訓(xùn)練樣本較多時(shí)或地類特征差異較明顯時(shí),提取效果比卷積神經(jīng)網(wǎng)絡(luò)差,且BP神經(jīng)網(wǎng)絡(luò)在該類具有針對(duì)性的分類提取應(yīng)用中,隨著分類器的不同會(huì)產(chǎn)生差別較大的特征判定,使其在進(jìn)行有針對(duì)性的分類提取工作中收到局限性影像。與之相比,卷積神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)識(shí)別、學(xué)習(xí)并存儲(chǔ)目標(biāo)結(jié)構(gòu)特征,同時(shí)自主改進(jìn)識(shí)別模式[19],因此在進(jìn)行多光譜影像建設(shè)用地信息提取中具有明顯優(yōu)勢(shì),尤其是在以曲靖市為代表的滇中城市取得了較好提取效果。
以曲靖市主城區(qū)為例,本文使用以卷積神經(jīng)為代表的深度學(xué)習(xí)方法對(duì)該區(qū)域Landsat8 OLI_TIRS多光譜遙感影像數(shù)據(jù)進(jìn)行城市建設(shè)用地信息提取,將當(dāng)前機(jī)器學(xué)習(xí)技術(shù)中較為前沿與熱門的深度卷積神經(jīng)網(wǎng)絡(luò)模型應(yīng)用于多光譜影像城市建設(shè)用地影像提取,研究對(duì)比了BP神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)兩種機(jī)器學(xué)習(xí)算法的提取精度,驗(yàn)證了深度學(xué)習(xí)技術(shù)在城市建筑用地遙感影像提取中具有一定優(yōu)勢(shì)。但在進(jìn)行Landsat8 OLI_TIRS數(shù)據(jù)預(yù)處理時(shí),在多光譜影像提取波段的選擇上未進(jìn)行足夠全面的分析和評(píng)價(jià),可能會(huì)影響后續(xù)處理精度[20]。另外,本文提取方法對(duì)城市大范圍建成區(qū)域和城市道路的提取效果較好,但對(duì)以鄉(xiāng)鎮(zhèn)為代表的小尺度建設(shè)用地提取仍存在一定改進(jìn)空間,深度學(xué)習(xí)相關(guān)理論研究和技術(shù)實(shí)現(xiàn)領(lǐng)域仍有很大空間有待拓展。本文利用深度卷積神經(jīng)網(wǎng)絡(luò)和卷積神經(jīng)網(wǎng)絡(luò)兩種分類器進(jìn)行監(jiān)督分類,人工選取樣本,并結(jié)合已有資料和野外調(diào)研數(shù)據(jù),雖然精度較高但較繁瑣,下一步可展開對(duì)樣本自動(dòng)選取的研究,提高提取工作的簡(jiǎn)便性和適用性,尤其是結(jié)合現(xiàn)有機(jī)器學(xué)習(xí)方法,未來有廣闊的研究空間[21]。