何予霄 周江
摘 要:遙感圖像的監(jiān)督分類(lèi)常用方法目前可以分為:平行六面體法,馬氏距離法,最大似然法,神經(jīng)網(wǎng)絡(luò)法以及支持向量機(jī)法等。文章將就以上所述的五種常用的監(jiān)督分類(lèi)方法在ENVI中分別對(duì)汶川縣威州鎮(zhèn)同一Landsat8 OLI數(shù)據(jù)進(jìn)行土地覆蓋與利用狀況分類(lèi).比較各種方法的分類(lèi)精度,并對(duì)之所產(chǎn)生的差異的原因進(jìn)行淺析,進(jìn)而對(duì)實(shí)際的生產(chǎn)以及應(yīng)用做出借鑒。
關(guān)鍵詞:監(jiān)督分類(lèi);平行六面體;神經(jīng)網(wǎng)絡(luò);支持向量機(jī);分類(lèi)精度
中圖分類(lèi)號(hào):P407.8 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2018)13-0022-03
Abstract: The common methods of supervised classification of remote sensing images can be divided into: parallelepiped classifier method, Mahalanobis distance method, maximum likelihood method, neural network method and support vector machine method. In this paper, the land cover and utilization of the same Landsat8 OLI data in Weizhou Town, Wenchuan County are classified by the five common supervised classification methods mentioned above in ENVI. Comparing the classification accuracy of various methods, we made an analysis of the causes of the differences, and then identify their actual production and application.
Keywords: supervised classification; parallelepiped; neural network; support vector machine; classification accuracy
1 概述
遙感圖像的分類(lèi)主要是利用計(jì)算機(jī)將遙感圖像中的光譜和空間信息進(jìn)行分析,提出不同地物之間的特征及邊界,并利用一定的算法的各個(gè)像元?jiǎng)潥w到互不重疊的各個(gè)子空間之中。遙感圖像的分類(lèi)的主要依據(jù)是不同地物在圖像上會(huì)反映出不同的亮度值(DN值),從而可以區(qū)分不同地物的差異。例如,河流、民宅、林地、草地、耕地等。
2 ENVI中基于遙感光譜圖像分類(lèi)方法
遙感影像通過(guò)亮度值或者像元值的高低差異(反映地物的光譜信息)以及空間變化(反映地物的空間信息)來(lái)表示不同地物的差異與區(qū)別,這是區(qū)分不同影像地物的物理基礎(chǔ)。遙感影像分類(lèi)就是利用計(jì)算機(jī)通過(guò)對(duì)遙感影像中各地類(lèi)的光譜信息和空間信息進(jìn)行分析,選擇其中所包含的特征,將圖像中的每個(gè)象元按照某種規(guī)則或者算法劃分成為不同的類(lèi)別,之后獲得遙感影像中與實(shí)際地物所對(duì)應(yīng)的信息,從而實(shí)現(xiàn)遙感影像的分類(lèi)。
遙感圖像的分類(lèi)分為監(jiān)督分類(lèi)與非監(jiān)督分類(lèi)。
非監(jiān)督分類(lèi)與監(jiān)督分類(lèi)最本質(zhì)的區(qū)別是是否存在訓(xùn)練樣本。若不存在訓(xùn)練樣本則稱(chēng)為非監(jiān)督分類(lèi),非監(jiān)督分類(lèi)使用的算法是對(duì)影像上的光譜信息進(jìn)行自動(dòng)的聚合,聚合之后的所生成的不同地類(lèi)需要后期人工進(jìn)行判讀;若存在訓(xùn)練樣本則稱(chēng)為監(jiān)督分類(lèi),監(jiān)督分類(lèi)是在計(jì)算機(jī)分類(lèi)之前人工對(duì)影像選擇若干樣本區(qū)域的位置與樣本類(lèi)型,之后選擇不同的分類(lèi)器或不同的算法將影像中其他區(qū)域歸入不同的樣本中。無(wú)論是非監(jiān)督分類(lèi)還是監(jiān)督分類(lèi)都是基于光譜的分類(lèi)方法,及基于遙感影像灰度值的分類(lèi)方法。
3 實(shí)驗(yàn)區(qū)選擇及實(shí)驗(yàn)方法
本文所選擇的實(shí)驗(yàn)區(qū)為四川省阿壩州汶川縣的Landsat-8 OLI為數(shù)據(jù)源,對(duì)原始數(shù)據(jù)進(jìn)行6,5,4波段RGB真彩色合成(增強(qiáng)植被水域的對(duì)比)。選擇汶川縣威州鎮(zhèn)為實(shí)驗(yàn)區(qū),進(jìn)行土地利用分類(lèi),以確定各種分類(lèi)方法的精度比較。
3.1 訓(xùn)練樣本可分離性判斷
在進(jìn)行分類(lèi)之前,先進(jìn)行人工樣本選取,創(chuàng)建5個(gè)ROI感興趣區(qū)訓(xùn)練樣本,為耕地,住宅用地,林地/草地,水域和其他,并且分別用黃色,紅色,綠色,藍(lán)色以及紫色表示。然后先計(jì)算樣本的可分離性。用Jeffries-Matusita和Transformed Divergence參數(shù)表示。這兩個(gè)參數(shù)的值在0~2.0之間,大于1.9說(shuō)明樣本之間的可分離性良好,小于1.8需重新選取樣本,小于1即考慮將兩樣本合成一類(lèi)樣本。本次工區(qū)樣本的可分離性為圖1所示。
本實(shí)驗(yàn)工區(qū)樣本之間本分離性均大于1.85,屬于合格樣本。
3.2 分類(lèi)器選擇與使用
用ENVI監(jiān)督分類(lèi)模塊進(jìn)行監(jiān)督分類(lèi)時(shí),采用不同的分類(lèi)器時(shí)選擇相同的人工訓(xùn)練樣本區(qū)域以比較不同分類(lèi)方法的分類(lèi)精度。選擇toolbox→Classification→Supervised Classification中找到不同類(lèi)型的分類(lèi)器。本文以支持向量機(jī)(Support vector machines,SVM)為例進(jìn)行分類(lèi)使用。
在Supervised Classification中選擇Support vector machines,點(diǎn)擊所需要分類(lèi)的圖像進(jìn)入SVM參數(shù)設(shè)置面板。SVM參數(shù)設(shè)置面板為圖2。
參數(shù)意義如下:
(1)Kernel Type下拉列表里選項(xiàng)有 Linear,Polynomial,Radial Basis Function和 Sigmoid。
a.如果選擇Polynomial,設(shè)置一個(gè)核心多項(xiàng)式(Degree of Kernel Polynomial)的次數(shù)用于SVM,最小值是1,最大值是6。
b.如果選擇Polynomial或者Sigmoid,使用向量機(jī)規(guī)則需要為Kernel指定the Bias,默認(rèn)值是1。
c.如果選擇是 Polynomial,Radial Basis Function,Sigmoid,需要設(shè)置Gamma in Kernel Function參數(shù)。這個(gè)值是一個(gè)大于零的浮點(diǎn)型數(shù)據(jù)。默認(rèn)值是輸入圖像波段數(shù)的倒數(shù)。
(2)Penalty Parameter:這個(gè)值是一個(gè)大于0的浮點(diǎn)型數(shù)據(jù)。這個(gè)參數(shù)控制了樣本錯(cuò)誤與分類(lèi)剛性延伸之間的平衡, 默認(rèn)值是100。
(3)Pyramid Levels:設(shè)置分級(jí)處理等級(jí),用于SVM訓(xùn)練和分類(lèi)處理過(guò)程。如果這個(gè)值為0,將以原始分辨率處理;最大值隨著圖像的大小而改變。
(4)Pyramid Reclassification Threshold(0~1):當(dāng)Pyramid Levels值大于0時(shí)候需要設(shè)置這個(gè)重分類(lèi)閾值。
(5)Classification Probability Threshold: 為分類(lèi)設(shè)置概率域值,如果一個(gè)像素計(jì)算得到所有的規(guī)則概率小于該值,該像素將不被分類(lèi),范圍是0~1,默認(rèn)是0。
(6)選擇分類(lèi)結(jié)果的輸出路徑及文件名。
(7)設(shè)置Out Rule Images為Yes,選擇規(guī)則圖像輸出路徑及文件名。
(8)單擊OK按鈕執(zhí)行分類(lèi)。
4 分類(lèi)結(jié)果與精度驗(yàn)證
在對(duì)實(shí)驗(yàn)工區(qū)進(jìn)行土地分類(lèi)之后,再進(jìn)行分類(lèi)后處理。采用混淆矩陣進(jìn)行精度驗(yàn)證,將不同方法的分類(lèi)以及Kappa系數(shù)進(jìn)行對(duì)照比較。
4.1 分類(lèi)結(jié)果與后處理結(jié)果
使用平行六面體,馬氏距離,最大似然,神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)對(duì)工區(qū)進(jìn)行分類(lèi)及后處理后所得結(jié)果分別為圖3-圖7所示。
4.2 混淆矩陣精度驗(yàn)證
在分類(lèi)結(jié)束后對(duì)不同方法的分類(lèi)后處理結(jié)果通過(guò)混淆矩陣進(jìn)行對(duì)照。本文以水域?yàn)槔?,分別對(duì)相關(guān)的精度因子進(jìn)行比較,如表1所示。
5 結(jié)束語(yǔ)
本文通過(guò)對(duì)五種監(jiān)督分類(lèi)方法的比較分析發(fā)現(xiàn)神經(jīng)網(wǎng)絡(luò),支持向量機(jī)在總體分類(lèi)精度,錯(cuò)分誤差和漏分誤差方面均明顯優(yōu)于最大似然,平行六面體、馬氏距離,分類(lèi)精度最高。而最大似然法次之,前三者分類(lèi)精度均高于平行六面體和馬氏距離。
神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的明顯優(yōu)點(diǎn):
(1)神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)能力和容錯(cuò)特性并且無(wú)需就模型作出假定,不需要對(duì)數(shù)據(jù)考慮是否存在正態(tài)分布或者連續(xù)性分布。能夠在特征空間上形成任意的多邊界決策面,再在動(dòng)態(tài)中調(diào)節(jié)決策邊界。在計(jì)算均值和方差時(shí)采用多次迭代,直到輸出結(jié)果達(dá)到與傳統(tǒng)的目視解譯結(jié)果滿(mǎn)足誤差要求。
(2)支持向量機(jī)是建立在統(tǒng)計(jì)學(xué)習(xí)理論上的機(jī)器學(xué)習(xí)方法??梢宰詣?dòng)尋找在間隔區(qū)邊緣的訓(xùn)練樣本點(diǎn),從而區(qū)分有較大區(qū)分能力的支持向量,將類(lèi)與類(lèi)之間的間隔最大化。
目前,沒(méi)有哪一種分類(lèi)是絕對(duì)最準(zhǔn)確,最實(shí)用的,對(duì)于具體的問(wèn)題,還是需要具體分析。每種分類(lèi)方法都有各自的優(yōu)劣性與實(shí)用性,選擇最適應(yīng)條件的分類(lèi)方法才能達(dá)到分類(lèi)精度的最優(yōu)化。隨著遙感技術(shù)的日新月異,綜合運(yùn)用各種方法進(jìn)行理論創(chuàng)新必將提高今后遙感影像分類(lèi)精度的不斷上升。
參考文獻(xiàn):
[1]趙文吉.ENVI遙感影像處理專(zhuān)題與實(shí)踐[M].北京:中國(guó)環(huán)境科學(xué)出版社,2007,04.
[2]童慶禧,張兵,鄭蘭芬.高光譜遙感原理、技術(shù)與應(yīng)用[M].北京:高等教育出版社,2006,06.
[3]王一達(dá),沈熙玲,謝炯.遙感圖像分類(lèi)方法綜述[J].遙感信息,2006:67-71.
[4]楊樹(shù)文.遙感數(shù)字圖像處理與分析ENVI 5.x實(shí)驗(yàn)教程[M].北京:電子工業(yè)出版社,2015,06.
[5]歐陽(yáng)霞輝.ArcGIS地理信息系統(tǒng)大全[M].北京:科技出版社,2010,11.
[6]李石華,王金亮,畢艷.遙感圖像分類(lèi)方法研究綜述[J].國(guó)土資源遙感,2015:1-6.