童威
摘? 要:隨著遙感技術(shù)的發(fā)展和遙感圖像采集方式的多樣性,對(duì)遙感圖像處理技術(shù)的要求更高。文章介紹了三種常見的監(jiān)督分類算法:支持向量機(jī)、最大似然法、BP神經(jīng)網(wǎng)絡(luò);并利用上述三種算法對(duì)南泥灣地區(qū)同一幅SuperView-1遙感影像進(jìn)行了分類,獲得分類解果并評(píng)估準(zhǔn)確性;然后對(duì)三種算法進(jìn)行了比較,分析三種算法的優(yōu)缺點(diǎn),得出支持向量機(jī)分類精度最低,最大似然法次之,神經(jīng)網(wǎng)絡(luò)最高;最后得出結(jié)論,BP神經(jīng)網(wǎng)絡(luò)是一種較為優(yōu)良的遙感影像分類算法。
關(guān)鍵詞:監(jiān)督分類;支持向量機(jī);最大似然法;BP神經(jīng)網(wǎng)絡(luò);遙感影像
中圖分類號(hào):P237 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2019)23-0006-04
Abstract: With the development of remote sensing technology and the diversity of remote sensing image acquisition methods, there is higher demand for remote sensing image processing technology. This paper introduces three common supervised classification algorithms: support vector machine, maximum likelihood method and BP neural network. The same SuperView-1 remote sensing image in Nanniwan area is classified by using the above three algorithms, and the classification results are obtained and the accuracy is evaluated. Then, the three algorithms are compared, and the advantages and disadvantages of the three algorithms are analyzed. It is concluded that the classification accuracy of support vector machine is the lowest, the maximum likelihood method is the second, and the neural network is the highest. Finally, it is concluded that BP neural network is an excellent remote sensing image classification algorithm.
Keywords: supervised classification; support vector machine; maximum likelihood method; BP neural network; remote sensing image
引言
隨著遙感技術(shù)的迅速發(fā)展,遙感圖像采集方法也越來(lái)越多樣化,其應(yīng)用也越來(lái)越廣泛。這對(duì)遙感圖像處理技術(shù)提出了很高的要求,尤其是對(duì)遙感圖像的解釋和分類,因此有必要對(duì)遙感圖像的分類及其算法進(jìn)行研究。遙感圖像分類是指通過(guò)計(jì)算機(jī)對(duì)遙感圖像的像素進(jìn)行分類。據(jù)特征選擇后的規(guī)則或算法分析光譜信息和空間信息,將每個(gè)像素劃分為不同的類別[1]。遙感圖像分類技術(shù)可以分為監(jiān)督分類和非監(jiān)督分類兩大類,前者需要訓(xùn)練樣本,而后者不需要;目前,遙感圖像分類新方法層出不窮,本文主要選取幾種常見的監(jiān)督分類方法,進(jìn)行實(shí)驗(yàn),并比較它們各自的優(yōu)缺點(diǎn),為遙感圖像分類算法選擇提供指導(dǎo)。
1 遙感影像監(jiān)督分類方法
1.1 支持向量機(jī)
基于統(tǒng)計(jì)訓(xùn)練,Vapnik提出了支持向量機(jī)(SVM)理論,基于最小化空間物體空間結(jié)構(gòu)風(fēng)險(xiǎn)的原理的非線性映射將樣本投射到高維空間中。構(gòu)造VC維度(Vapnik-Chervonenkis)并使用可能的最佳超平面作為分類平面,并最小化分類風(fēng)險(xiǎn)的上限,使分類算法具有最佳的泛化能力[2-4]。解決優(yōu)化問(wèn)題并將特征向量從低維空間映射到多維空間。在多維特征空間中找到最優(yōu)分類超平面,從而解決復(fù)雜數(shù)據(jù)分類問(wèn)題[5-7]。
在圖1所示的二維情況下,實(shí)心點(diǎn)和空心點(diǎn)分別代表兩種不同類型的樣本,虛線是分類線,兩條實(shí)線分別是最接近分類線并平行于分類線的直線。它們之間的距離稱為分類間隔,分類的最佳平面是超平面,它在最大分類間隔上正確地分離兩種類型的樣本[8]。
1.2 最大似然法
最大似然分類使用遙感衛(wèi)星的多頻帶數(shù)據(jù)的分布作為多維正態(tài)分布來(lái)構(gòu)造判別分類函數(shù)?;舅枷胧敲款愐阎袼卦谄矫婊蚩臻g中形成特定的點(diǎn)群;每種類型數(shù)據(jù)的每個(gè)維度在數(shù)軸上形成正態(tài)分布,并且該類的多維數(shù)據(jù)構(gòu)成多維正態(tài)分布,具有各種類型的多維分布模型,對(duì)于任何未知類別的數(shù)據(jù)源,可以被反轉(zhuǎn)以找出它屬于每種類型的概率;根據(jù)概率的大小,比較哪種類型的概率大,這個(gè)像元就屬于這個(gè)類[10]。
最大似然分類法的判別規(guī)則為,如果某個(gè)待分類像元x滿足下式:
(12)
則x∈wi,其中M表示影像大小,b表示類別大小,n表示影像波段數(shù)[11]。在最大似然法的實(shí)際計(jì)算中,常采用經(jīng)過(guò)對(duì)數(shù)變換的形式:
式中:p(wk)是某一類wk在圖像中的概率,在預(yù)先不知道p(wk)是多少的情況下,可以認(rèn)為所有的p(wk)都相同,即p(wk)=1/c,?撞k為第k類的協(xié)方差矩陣,mk為該類的均值向量。對(duì)于任何一個(gè)像元值xi,其在哪一類中g(shù)k(xi)最大,就屬于哪一類。
1.3 BP神經(jīng)網(wǎng)絡(luò)
20世紀(jì)80年代,Rumelhart等[12]提出了反向傳播算法,后來(lái)逐漸發(fā)展為BP神經(jīng)網(wǎng)絡(luò)。BP神經(jīng)網(wǎng)絡(luò)是一種多層結(jié)構(gòu)的多層前饋神經(jīng)網(wǎng)絡(luò)。常用的BP神經(jīng)網(wǎng)絡(luò)模型由三層組成,初始層為輸入層,中間層為隱藏層,最后一層為輸出層。相鄰的神經(jīng)元層通過(guò)連接權(quán)值相互連接,而每一層的神經(jīng)元不連接。如圖2所示。
網(wǎng)絡(luò)的實(shí)現(xiàn)分為前向傳播和反向傳播兩個(gè)過(guò)程。在前向傳播的情況下,在將訓(xùn)練樣本輸入網(wǎng)絡(luò)后,輸入層神經(jīng)元獲得學(xué)習(xí)樣本的活性化值,經(jīng)由輸入層和中間層的處理傳播到輸出層,輸出層的各神經(jīng)元得到網(wǎng)絡(luò)的輸入響應(yīng)后,所得到的輸出被輸入到網(wǎng)絡(luò),與期望的輸出進(jìn)行比較。如果實(shí)際輸出不等于預(yù)期輸出,則進(jìn)入反向傳播過(guò)程,根據(jù)減少目標(biāo)輸入的方向和實(shí)際誤差,從輸出層逐層校正連接權(quán)重通過(guò)每個(gè)中間層,最后返回到輸入層并重復(fù),直到獲得最小錯(cuò)誤,以獲得最佳結(jié)果[13]。
2 實(shí)驗(yàn)過(guò)程及結(jié)果
2.1 實(shí)驗(yàn)數(shù)據(jù)
本實(shí)驗(yàn)選取SuperView-1拍攝的延安市南泥灣附近的遙感影像,空間分辨率為2m左右,如圖3所示。影像大小為2900像素×2900像素;從影像上可以看出,其中分布著田地,林地,建筑物,裸地等,且影像分辨率較高,適合遙感影像的分類。
2.2 定義訓(xùn)練樣本
從RGB彩色圖像上獲取ROI以創(chuàng)建感興趣區(qū)域。本文共創(chuàng)建4種訓(xùn)練樣本,分別為田地,林地,建筑物,裸地,對(duì)應(yīng)顏色分別為紅色,綠色,藍(lán)色,黃色,并且分別畫出相應(yīng)的感興趣區(qū)(如圖4所示)。
2.3 評(píng)價(jià)訓(xùn)練樣本
ROI可分性工具用于計(jì)算所有類別之間的統(tǒng)計(jì)距離,并且兩個(gè)類別之間的差異程度由距離確定。計(jì)算該測(cè)試的可分離性,具體見圖5。
計(jì)算Jeffreys-Matusita距離和感興趣區(qū)域的每個(gè)組合的Transformed Divergence。這兩個(gè)參數(shù)的大小決定了訓(xùn)練樣本選擇的合理性。各種參數(shù)值的含義如下:(1)當(dāng)參數(shù)值為1.9-2.0時(shí),樣本之間具有良好的可分離性,即合格樣本;(2)當(dāng)參數(shù)值為1.0-1.8時(shí),樣本必須重新選擇;(3)當(dāng)參數(shù)為0.1-1.0時(shí),兩種類型樣本中的差異很小,樣本合并為一種[14]。從圖5可以看出:林地與建筑物、裸地,田地與林地的參數(shù)值均大于1.9,可分離性好;而田地與建筑物、裸地,建筑物與裸地的參數(shù)值小于1.8;這是由于建筑與田地的光譜特征非常接近,經(jīng)過(guò)反復(fù)試驗(yàn),最終獲得了可用的訓(xùn)練樣本。
2.4 執(zhí)行分類
通過(guò)監(jiān)督分類對(duì)圖像分別用支持向量機(jī)、最大似然法、BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類,為了對(duì)比三種不同算法的精度及優(yōu)缺點(diǎn),試驗(yàn)采用了相同的訓(xùn)練樣本。支持向量機(jī)、最大似然法、BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果如圖6-8所示。圖4中大部分為紅色和綠色,即田地與林地。經(jīng)過(guò)目視比對(duì),可以明顯看出田地與林地分類精度較高。
2.5 分類結(jié)果評(píng)價(jià)
為了定量評(píng)估上述三種分類結(jié)果的優(yōu)缺點(diǎn),采用混淆矩陣法對(duì)三種方法進(jìn)行了評(píng)價(jià)?;煜仃囃ㄟ^(guò)將地表真實(shí)圖像與分類圖像進(jìn)行比較,在混淆矩陣中顯示分類結(jié)果的準(zhǔn)確性。通過(guò)上述方法,以田地為例對(duì)相關(guān)精度進(jìn)行分析和比較,比較和總結(jié)了三種不同分類方法和Kappa系數(shù)的準(zhǔn)確性;從表1中可以看出:BP神經(jīng)網(wǎng)絡(luò)的總體精度和Kappa系數(shù)均為最高,是一種較為優(yōu)良的分類算法。
3 結(jié)束語(yǔ)
遙感影像分類精度的提高一直是研究的熱點(diǎn)問(wèn)題。通過(guò)對(duì)三種常見監(jiān)督分類方法的比較分析,發(fā)現(xiàn)BP神經(jīng)網(wǎng)絡(luò)中的土地利用分類最接近實(shí)際情況,分類精度最高。最大似然法次之,支持向量機(jī)的精度最低。BP神經(jīng)網(wǎng)絡(luò)優(yōu)于傳統(tǒng)的分類方法:
(1)BP神經(jīng)網(wǎng)絡(luò)法對(duì)于數(shù)據(jù)分布的特征沒有任何假定前提。無(wú)論數(shù)據(jù)是正態(tài)分布還是非連續(xù)分布,可以在特征空間形成任意邊界的決策面,每次重復(fù)都能動(dòng)態(tài)地調(diào)整決定區(qū)域,表明BP神經(jīng)網(wǎng)絡(luò)的強(qiáng)有力的穩(wěn)定性和優(yōu)勢(shì)。
(2)BP神經(jīng)網(wǎng)絡(luò)的監(jiān)督分類與常規(guī)的統(tǒng)計(jì)監(jiān)督分類非常相似。主要區(qū)別在于訓(xùn)練和分類的過(guò)程:最大似然方法的平均值和方差僅計(jì)算一次,而BP的神經(jīng)網(wǎng)絡(luò)方法使用迭代算法直到計(jì)算結(jié)果與實(shí)際值之間的差異結(jié)果符合要求。
(3)BP的神經(jīng)網(wǎng)絡(luò)方法是非線性的,與傳統(tǒng)的分類方法相比,可以處理復(fù)雜的數(shù)據(jù)集并準(zhǔn)確識(shí)別模型,并且可以使用多源數(shù)據(jù)來(lái)提取潛在信息。
當(dāng)然,目前每一種方法在分類上都有局限性,而且沒有一種方法是絕對(duì)最佳的。因此,必須合理地使用這些方法。根據(jù)遙感圖像的光譜特征、紋理特征和所需精確度選擇分類算法;在確保準(zhǔn)確性的前提下,盡可能提高分類的效率。
參考文獻(xiàn):
[1]金杰,朱海巖,李子瀟,等.ENVI遙感圖像處理中幾種監(jiān)督分類方法的比較[J].水利科技與經(jīng)濟(jì),2014,20(01):146-148+160.
[2]Vapnik V N.Statistical Learning Theory[M].New York:Wiley,1998.
[3]張勇.基于SVM遙感圖像專題信息提取研究[D].中南大學(xué),2005.
[4]劉江華,程君實(shí),陳佳品.支持向量機(jī)訓(xùn)練算法綜述[J].信息與控制,2002(01):45-50.
[5]劉志剛,李德仁,秦前清,等.支持向量機(jī)在多類分類問(wèn)題中的推廣[J].計(jì)算機(jī)工程與應(yīng)用,2004(07):10-13+65.
[6]李毅,徐守時(shí).基于支持向量機(jī)的遙感圖像艦船目標(biāo)識(shí)別方法[J].計(jì)算機(jī)仿真,2006(06):180-183.
[7]楊娜,秦志遠(yuǎn),張俊.基于支持向量機(jī)無(wú)限集成學(xué)習(xí)方法的遙感圖像分類[J].測(cè)繪科學(xué),2013,38(01):47-50.
[8]李航.統(tǒng)計(jì)學(xué)習(xí)方法[M].北京:清華大學(xué)出版社,2012.
[9]李萌.基于支持向量機(jī)的高分遙感影像分類技術(shù)研究與應(yīng)用[D].中國(guó)地質(zhì)大學(xué)(北京),2015.
[10]劉志剛.支持向量機(jī)在光譜遙感影像分類中的若干問(wèn)題研究[D].武漢大學(xué),2004.
[11]王增林,朱大明.基于遙感影像的最大似然分類算法的探討[J].河南科學(xué),2010,28(11):1458-1461.
[12]譚玉敏,夏瑋.基于最佳波段組合的高光譜遙感影像分類[J].測(cè)繪與空間地理信息,2014(4):19-22.
[13]聞新,周露,熊曉英.Matlab神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(jì)[M].北京:科學(xué)出版社,2000.
[14]鄧書斌.ENVI遙感圖像處理方法[M].高等教育出版社,2014.