劉瑞航 張佳瑜 馬彩虹
(寧夏大學(xué) 地理科學(xué)與規(guī)劃學(xué)院,寧夏 銀川 750021)
遙感影像地物分類作為遙感技術(shù)的一個(gè)重要領(lǐng)域,一直倍受研究人員的關(guān)注。近年來(lái),隨著遙感技術(shù)的不斷發(fā)展,衛(wèi)星傳感器獲取的遙感影像空間分辨率也在不斷提高,遙感圖像分類已經(jīng)成為獲取地物信息的有效手段[1-5]。然而,由于遙感影像自身空間分辨率的差別以及地物在遙感影像中的“同物異譜”和“同譜異物”的特點(diǎn)[6-8],傳統(tǒng)的監(jiān)督分類在進(jìn)行地物分類時(shí)容易出現(xiàn)“錯(cuò)分”“漏分”的現(xiàn)象,導(dǎo)致分類精度不高[9-10]。
為解決傳統(tǒng)監(jiān)督分類存在的問(wèn)題,許多學(xué)者引進(jìn)了不同的方法。Vapnik等[11]提出了支持向量機(jī)方法在解決小樣本、非線性問(wèn)題上的優(yōu)勢(shì),其適用于復(fù)雜地理?xiàng)l件下的地物分類;王佃來(lái)等[12]基于輔助前饋(back propagation,BP)算法結(jié)合K近鄰(K-Nearest Neighbor,KNN)模型,較好地解決了山體陰影和水體之間的誤分問(wèn)題;曹兆偉等[13]實(shí)驗(yàn)證明了BP神經(jīng)網(wǎng)絡(luò)算法在海島地物分類中是一種行之有效且精確度更高的分類方法;梁玉劍等[14]基于BP神經(jīng)網(wǎng)絡(luò)對(duì)遙感影像地物分類的方法進(jìn)行研究,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)的分類精度明顯優(yōu)于其他監(jiān)督分類算法;王威等[15]基于圖像分割及神經(jīng)網(wǎng)絡(luò)提出了一種能夠顯著提高道路提取效率的方法。其中,BP神經(jīng)網(wǎng)絡(luò)的較強(qiáng)學(xué)習(xí)能力、輸入?yún)?shù)靈活自由等特點(diǎn)能夠很好地結(jié)合遙感影像的光譜特征、高程、坡度、坡向等信息,對(duì)土地覆蓋類別進(jìn)行較為準(zhǔn)確的識(shí)別。
大量的研究結(jié)果表明,BP神經(jīng)網(wǎng)絡(luò)具有收斂速度快、識(shí)別精度高等特點(diǎn),適用于遙感影像的土地覆蓋分類。本文利用矩陣工廠(matrix laboratory,MATLAB)軟件的模式識(shí)別工具箱,以最佳指數(shù)法(optimum index factor,OIF)選取研究區(qū)的最佳波段組合和歸一化植被指數(shù)(normalized difference vegetation index,NDVI)為BP神經(jīng)網(wǎng)絡(luò)的輸入,研究區(qū)的土地覆蓋類型為BP神經(jīng)網(wǎng)絡(luò)的輸出,依據(jù)訓(xùn)練數(shù)據(jù)構(gòu)建BP神經(jīng)網(wǎng)絡(luò)模型,通過(guò)模式識(shí)別的方法實(shí)現(xiàn)對(duì)銀川市三區(qū)遙感影像的像素點(diǎn)進(jìn)行分類,進(jìn)而實(shí)現(xiàn)土地覆蓋分類,并采用混淆矩陣的方法對(duì)分類結(jié)果進(jìn)行精度評(píng)定,驗(yàn)證此識(shí)別模型在銀川市三區(qū)土地覆蓋分類中的合理性和可靠性。
銀川市地處中國(guó)西北地區(qū)寧夏平原中部(37°29′~38°53′N,105°49′~106°53′E),是寧夏回族自治區(qū)的首府,是自治區(qū)政治、經(jīng)濟(jì)、文化科研、交通和金融中心。研究區(qū)包括銀川市三區(qū)(西夏區(qū)、金鳳區(qū)、興慶區(qū)),西倚賀蘭山、東臨黃河,地貌類型多樣,自西向東分為賀蘭山地、洪積扇前傾斜平原、洪積沖積平原、河漫灘地等。
本次研究使用的數(shù)據(jù)是在地理空間數(shù)據(jù)云(https://www.gscloud.cn)中下載獲取美國(guó)陸地衛(wèi)星8號(hào)陸地成像儀(land satellite 8 operational land imager,Landsat8 OLI)遙感影像數(shù)據(jù),其獲取時(shí)間是2020年7月28日,數(shù)據(jù)含云量<5%,質(zhì)量較好,對(duì)影像進(jìn)行輻射定標(biāo)、大氣校正、影像融合、裁剪等預(yù)處理。
多光譜遙感影像數(shù)據(jù)提供了豐富的地物光譜特征,但是地物在各波段的輻射強(qiáng)度存在一定的相關(guān)性,而相關(guān)性大的波段組合所包含的信息量會(huì)出現(xiàn)大量的冗余。查維茨提出的OIF的概念可以用來(lái)選擇信息量大且相關(guān)性小的波段組合,即
(1)
式中,Y為各個(gè)波段組合OIF值;Si為第i個(gè)波段的標(biāo)準(zhǔn)差;Rij為i、j兩波段之間的相關(guān)系數(shù)。對(duì)n波段圖像數(shù)據(jù),先計(jì)算其每個(gè)波段的標(biāo)準(zhǔn)差及相關(guān)系數(shù)矩陣,然后分別求出所有可能三組波段對(duì)應(yīng)的OIF值。
BP神經(jīng)網(wǎng)絡(luò)的基本思想是把學(xué)習(xí)過(guò)程分為信息的正向傳播和誤差的反向傳播兩個(gè)過(guò)程。它是一種單向傳播的多層前饋網(wǎng)絡(luò),其結(jié)構(gòu)包括輸入層、中間層和輸出層(圖1)。當(dāng)學(xué)習(xí)樣本數(shù)據(jù)輸入網(wǎng)絡(luò)后,經(jīng)過(guò)隱藏層的處理后得到對(duì)應(yīng)輸出模式,完成了一次學(xué)習(xí)的正向傳播。當(dāng)?shù)玫降妮敵瞿J脚c預(yù)期模式不符時(shí),則開(kāi)始進(jìn)行誤差的反向傳播階段,誤差在反向傳播過(guò)程中按照梯度下降的模式對(duì)各層結(jié)點(diǎn)的連接權(quán)重進(jìn)行調(diào)整,最后返回到輸入層。通過(guò)不斷正向?qū)W習(xí)和誤差反向傳播,使得網(wǎng)絡(luò)結(jié)構(gòu)達(dá)到最佳、輸出誤差減少到可以接受的范圍。
圖1 神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
(1)輸入層和輸出層節(jié)點(diǎn)數(shù)。BP神經(jīng)網(wǎng)絡(luò)輸入層和輸出層節(jié)點(diǎn)數(shù)要根據(jù)實(shí)際情況來(lái)確定。研究使用經(jīng)OIF確定的最佳波段組合,同時(shí),為了更好地區(qū)分植被與其他地物,加入NDVI作為輸入?yún)?shù)之一,可確定輸入層的節(jié)點(diǎn)數(shù);研究區(qū)遙感影像地物分類數(shù),就是輸出層節(jié)點(diǎn)數(shù)。
(2)隱藏層節(jié)點(diǎn)數(shù)。網(wǎng)絡(luò)隱藏層的節(jié)點(diǎn)數(shù)對(duì)訓(xùn)練結(jié)果有很大的影響。過(guò)少的節(jié)點(diǎn)數(shù)使得網(wǎng)絡(luò)不能充分地訓(xùn)練,導(dǎo)致訓(xùn)練的精度不高;過(guò)多的節(jié)點(diǎn)數(shù)使得網(wǎng)絡(luò)計(jì)算量增加、訓(xùn)練時(shí)間過(guò)長(zhǎng)、容錯(cuò)率低,不利于得到精度較高的結(jié)果。然而,目前對(duì)于隱藏層節(jié)點(diǎn)數(shù)的計(jì)算并沒(méi)有一個(gè)確切的數(shù)學(xué)公式來(lái)求解,只能根據(jù)實(shí)際訓(xùn)練情況不斷調(diào)整。本研究根據(jù)式(2)[12]進(jìn)行初步確定。
(2)
式中,N為隱藏層節(jié)點(diǎn)數(shù);A為分類數(shù)量;B為特征向量維數(shù)。經(jīng)多次實(shí)驗(yàn),本研究的隱含層節(jié)點(diǎn)數(shù)為10。
(3)訓(xùn)練參數(shù)設(shè)置。神經(jīng)網(wǎng)絡(luò)創(chuàng)建函數(shù)為patternnet,網(wǎng)絡(luò)訓(xùn)練函數(shù)采用trainscg,輸入層和輸出層的激活函數(shù)如式(3)所示,訓(xùn)練期望誤差為0.01,最大迭代次數(shù)為1 000次。
(3)
式中,zi為第i個(gè)節(jié)點(diǎn)的輸出值;C為輸出節(jié)點(diǎn)的個(gè)數(shù)。
利用遙感影像處理平臺(tái)(the environment for visualizing images,ENVI)5.3得到研究區(qū)OLI各波段統(tǒng)計(jì)數(shù)據(jù)及相關(guān)系數(shù)矩陣。發(fā)現(xiàn)影像各波段標(biāo)準(zhǔn)差的大小順序?yàn)锽and5>Band6>Band7>Band4>Band3>Band2>Band1。其中,Band5信息量最為豐富,Band6也較為豐富。Band1、Band2、Band3這三個(gè)波段相關(guān)性顯著,相關(guān)系數(shù)在0.981 2~0.996 4,而其與其他波段相關(guān)性相對(duì)較小;近紅外Band5與可見(jiàn)光Band1、Band2、Band3、Band4相關(guān)性較小;中紅外Bnad6、Band7之間相關(guān)性較顯著,見(jiàn)表1。
表1 波段組合及對(duì)應(yīng)的OIF值
OIF值越大,則相應(yīng)組合圖像的信息量越大,對(duì)OIF進(jìn)行升序排列,OIF最大的波段組合即為最優(yōu)波段組合。根據(jù)上述計(jì)算得到各波段的標(biāo)準(zhǔn)差以及各波段之間的相關(guān)系數(shù),利用OIF計(jì)算公式,在MATLAB中計(jì)算所有可能的波段組合及對(duì)應(yīng)的OIF值(表1)??芍?Band4、Band5、Band6波段組合的OIF值最大,選擇為最佳波段組合。
應(yīng)用ENVI5.3得到各ROI的4個(gè)參數(shù),經(jīng)歸一化、去除異常值等數(shù)據(jù)預(yù)處理后,作為神經(jīng)網(wǎng)絡(luò)訓(xùn)練的最終輸入?yún)?shù)。輸出的目標(biāo)矩陣為6行n列的單位矩陣,每一行對(duì)應(yīng)一類地物,其形式為:
T=[000 001%耕地
000 010%林地
000 100%草地
001 000%水域
010 000%建設(shè)用地
100 000%未利用地]
神經(jīng)網(wǎng)絡(luò)在訓(xùn)練到105代達(dá)到最佳,誤差為0.024 6(圖2)。其中橫坐標(biāo)為迭代次數(shù),縱坐標(biāo)為交叉熵值。
圖2 BP神經(jīng)網(wǎng)絡(luò)收斂過(guò)程
待分類的遙感影像數(shù)據(jù)不能直接輸入到網(wǎng)絡(luò)中仿真,在MATLAB中采用imread函數(shù)可以將待分類的遙感影像分解成若干灰度向量。本研究采用Landsat8 OLI多波段影像,故被分解成7個(gè)灰度向量。選取基于OIF得到的Band4、Band5、Band6以及NDVI作為BP神經(jīng)網(wǎng)絡(luò)的輸入?yún)?shù),進(jìn)行仿真得到分類圖(圖3)。
圖3 OIF輔助BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果
為了驗(yàn)證改進(jìn)的BP神經(jīng)網(wǎng)絡(luò)分類的有效性,將其分類結(jié)果與最大似然法的分類結(jié)果(圖4)、支持向量機(jī)(support vector machine,SVM)分類結(jié)果(圖5)進(jìn)行精度對(duì)比。為保證分析結(jié)果具有可比性,采用變量一致性原則,各分類方法使用相同的訓(xùn)練樣本及測(cè)試樣本,見(jiàn)表3。
圖4 最大似然法分類結(jié)果
圖5 SVM分類結(jié)果
表3 三種分類方法的混淆矩陣
從以上3類分類算法的混淆矩陣及精度評(píng)定(表4)可以看出,OIF輔助BP神經(jīng)網(wǎng)絡(luò)的模式識(shí)別方法在總精度(86.95%)和Kappa系數(shù)(0.843 5)方面均具優(yōu)勢(shì);從生產(chǎn)者精度來(lái)看,該方法在林地、草地、水域和未利用地的分類中優(yōu)勢(shì)明顯,精度都超過(guò)了90.00%,但在建設(shè)用地的分類中精度較低只有70.73%。OIF輔助BP神經(jīng)網(wǎng)絡(luò)的模式識(shí)別方法在耕地分類上精度為81.44%,略高于最大似然法的81.06%和SVM分類法的80.68%,三者相差不大;在林地分類上,精度明顯優(yōu)于最大似然法和SVM分類法,達(dá)到了92.49%,高于最大似然法的77.47%、SVM分類法的77.08%;在草地的分類中,精度達(dá)到了93.45%,相較于最大似然法精度(77.82%)和SVM分類法精度(74.55%),具有明顯的優(yōu)勢(shì);在未利用地的分類上,精度為92.38%,遠(yuǎn)高于最大似然法的63.81%和SVM分類法的46.19%;在水域的分類上,精度為93.61%,遠(yuǎn)高于最大似然法的60.15%,略低于SVM分類法的95.11%;對(duì)于建設(shè)用地的分類該方法不具優(yōu)勢(shì),精度為70.73%,低于最大似然法的97.21%和SVM分類法的72.47%。
表4 三種分類方法Kappa系數(shù)與總體精度對(duì)比
本研究以Landsat8 OLI遙感影像為數(shù)據(jù)源,構(gòu)建了OIF輔助BP神經(jīng)網(wǎng)絡(luò)模式識(shí)別模型,與最大似然法分類法、SVM分類法比較,其強(qiáng)大的非線性映射能力和靈活的網(wǎng)絡(luò)結(jié)構(gòu)能夠?qū)A繑?shù)據(jù)進(jìn)行高效地處理,顯著提高了分類總體精度,現(xiàn)研究結(jié)論如下:①OIF輔助的BP神經(jīng)網(wǎng)絡(luò)的模式識(shí)別模型的輸入?yún)?shù)靈活,可用于地表覆蓋種類多樣的地區(qū),可以精準(zhǔn)高效地對(duì)銀川市三區(qū)土地覆蓋進(jìn)行分類;②OIF輔助BP神經(jīng)網(wǎng)絡(luò)模式識(shí)別的總精度為86.95%,Kappa系數(shù)為0.843 5,優(yōu)于SVM分類法和與最大似然法;③OIF輔助的BP神經(jīng)網(wǎng)絡(luò)的模式識(shí)別對(duì)林地、草地、未利用地的識(shí)別精度遠(yuǎn)高于最大似然法分類精度;耕地分類依然存在著錯(cuò)分與漏分問(wèn)題,但相較于最大似然法和SVM分類算法,精度有了提高;對(duì)于建設(shè)用地的識(shí)別精度較低,與最大似然法有一定差距。
研究存在一些不足:受數(shù)據(jù)源空間分辨率的限制,并未對(duì)研究區(qū)進(jìn)行更精細(xì)的分類;在構(gòu)建分類模型時(shí)研究?jī)H對(duì)輸入?yún)?shù)進(jìn)行了調(diào)整;對(duì)建設(shè)用地的識(shí)別精度較低。在后續(xù)研究中,可以采用更高空間分辨率的影像,對(duì)神經(jīng)網(wǎng)絡(luò)輸入?yún)?shù)和隱藏層結(jié)構(gòu)進(jìn)行優(yōu)化改進(jìn),以及探究不同的激活函數(shù)對(duì)分類結(jié)果的影響;也可嘗試引入面向?qū)ο蟮乃枷?構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),進(jìn)一步完善土地覆蓋分類的方法。