基于SAM算法的遙感影像濕地植被分類
李明澤,張培贏
(東北林業(yè)大學(xué) 林學(xué)院,哈爾濱 150040)
摘要:以黑龍江省扎龍自然濕地保護(hù)區(qū)高光譜遙感影像為試驗區(qū)域,通過對野外試驗調(diào)查數(shù)據(jù)和預(yù)處理后的高光譜遙感影像進(jìn)行前期處理,再采用光譜角填圖(SAM)圖像分類方法進(jìn)行植被分類實驗得出結(jié)果,并與最大似然法和支持向量機(jī)(SVM)分類方法結(jié)果進(jìn)行對比研究分析,通過實驗結(jié)果得出誤差矩陣和精度評價分析,得到最大似然法的總體分類精度和以及Kappa系數(shù)是最低的,而光譜角填圖分類方法的總體精度為89.87%,Kappa系數(shù)為0.880 7,分類結(jié)果要好于其他兩種分類方法,其對高光譜遙感影像植被分類實驗更具有準(zhǔn)確性和實用性。
關(guān)鍵詞:光譜角填圖;植被分類;精度評價
中圖分類號:S 757.1
文獻(xiàn)標(biāo)識碼:A
文章編號:1001-005X(2015)02-0008-06
Abstract:This paper takes the hyperspectral remote sensing image of Zhalong protection wet land in Heilongjiang province as a test,pre-processes the field collected data and the pre-treated hyperspectral remote sensing image,applies the method of SAM to classify the vegetation,and compares with the results derived by using the maximum likelihood method and the SVM method.Through the error matrix and accuracy assesment,it is found that the accuracy of classification by the maximum likelihood method and Kappa coefficient are the lowest,while the accuracy of SAM is as high as 89.87% and the Kappa coefficient is 0.8807,which is better than the results of the other two methods.It is shown that SAM is more useful and practical to classify vegetation based on hyperspectral remote sensing image.
Keywords:SAM;vegetation classification;classification accuracy
收稿日期:2014-12-25
基金項目:黑龍江省省院科技合作項目(HZ201315)
作者簡介:第一李明澤,博士,副教授。研究方向:森林經(jīng)理學(xué)。E-mail:mingzelee@163.com
Classification of Wetland Vegetation in HyperspectralRemote Sensing Image Based on SAM Algorithm
Li Mingze,Zhang Peiying
(School of Forestry,Northeast Forestry University,Harbin 150040)
引文格式:李明澤,張培贏.基于SAM算法的遙感影像濕地植被分類[J].森林工程,2015,31(2):8-13.
濕地被譽(yù)為地球上最重要的生態(tài)系統(tǒng)之一,但隨著人類社會的發(fā)展破壞,導(dǎo)致自然生存條件逐漸惡劣??茖W(xué)調(diào)查顯示全球自然濕地的面積正逐年漸漸流失。人類破壞了濕地本有的原始景觀格局,而濕地內(nèi)部的各種植被種類分布也隨之受到了災(zāi)害性影響。隨著科學(xué)的普及和教育的進(jìn)步,近十幾年來對濕地的價值開始逐漸認(rèn)識并重視起來,科學(xué)家和環(huán)保人士已經(jīng)開始研究和保護(hù)自然濕地中的原始植被工程。濕地其分布廣泛,相對于種類也是比較繁多,這導(dǎo)致區(qū)域性差異突出,濕地植被研究中今天依然沒出現(xiàn)統(tǒng)一分類標(biāo)準(zhǔn)體系。傳統(tǒng)的遙感影像分類方法對于濕地植被分類一般都基于多光譜影像,但是通過結(jié)果發(fā)現(xiàn)由于不同地物的光譜特征有時候會非常接近,那么這些分類方法很難將其區(qū)分開,這就容易造成試驗中分類結(jié)果的混淆。而具有上百個較窄波段高光譜影像可以有效的解決這個難題[1]。在遙感(RS)中高光譜遙感具有以下幾個重要特點。
(1)影像的波段含有量非常多,其在近紅外光譜區(qū)域以及可見光區(qū)內(nèi)有數(shù)十至數(shù)百個波段。
(2)影像光譜的分辨率是可以達(dá)到非常高的數(shù)值的,采用的高光譜成像光譜儀采樣間隔相對比較小,一般情況都會小于10 nm,從而地物較細(xì)微的光譜特征可以被較高的光譜分辨率良好的反映呈現(xiàn)出來。
(3)高光譜遙感影像中每個相鄰波段的相關(guān)性通常都較高,從而使得信息冗余度大大的增加了。
(4)空間維信息和光譜維信息可以被同時的提供出來,也就是常說的“圖譜合一”的特點,可以在高光譜遙感影像上提取某一地物的光譜曲線與地面科學(xué)實際測量的同類地物光譜曲線來進(jìn)行分析和研究對比。
目前,比較常用的分類方法如最大似然法分類,支持向量機(jī)方法分類已經(jīng)比較普遍的應(yīng)用到了遙感影像分類試驗中,王欽敏等[2]遙感圖像最大似然分類分類方法的 EM 改進(jìn)算法,其使得分類精度大幅提高。王延飛,溫小榮等[3]濕地覆被的幾種遙感監(jiān)督分類方法比較——以江蘇鹽城濕地珍禽國家級自然保護(hù)區(qū)核心區(qū)為例,通過把高光譜的這些優(yōu)勢合理的利用,來實現(xiàn)對濕地中的植被進(jìn)行精度較高的分類實驗研究,取得了較滿意的實驗成果。作者通過使用SAM分類方法來對扎龍自然濕地的高光譜遙感影像進(jìn)行植被分類試驗,對分類結(jié)果進(jìn)行對比分析,以觀察SAM影像分類方法在濕地的植被分類中是否具有實踐性、可行性。
1研究區(qū)概況與研究方法
扎龍國家級大自然濕地保護(hù)區(qū)地處黑龍江齊齊哈爾市境內(nèi)及富裕境內(nèi)、林甸杜蒙以及泰來縣境內(nèi)的交界地區(qū)。扎龍自然濕地是我國松嫩平原濕地自然生態(tài)系統(tǒng)中重要的大自然留給人類的資源。如圖1所示,扎龍自然保護(hù)區(qū)長65 km,寬37 km,總面積達(dá)到21萬hm2,目前里面有核心區(qū)大約7萬hm2,而緩沖區(qū)也有6.7萬hm2以及目前的實驗區(qū)大約7萬hm2。扎龍自然濕地保護(hù)區(qū)生物多樣性保有量非常的豐富,其中野生類植物占 大約500 種之多,目前是全球丹頂鶴種類最繁多和生存面積最廣闊的丹頂鶴繁殖棲息地區(qū)。
作者根據(jù)實際需要,使用ASD野外光譜輻射儀實地測量獲取植被的高光譜數(shù)據(jù),該儀器有512個波段以及波長范圍350~1 050 nm,光譜分辨率達(dá)到了3.5 nm。測量時為中午,天氣無風(fēng)。本文采用的遙感影像為資源三號衛(wèi)星高光譜遙感影像,該衛(wèi)星搭載了全色TDI-CCD相機(jī)以及正視多光譜相機(jī)。見表1。
圖1 扎龍濕地自然保護(hù)區(qū)實驗區(qū)范圍 Fig.1 The scope of the experimental spot in Zhalong wetland nature reserve area
表1 資源三號有效載荷技術(shù)指標(biāo) Tab.1 Resources satellite payload technical indicators for number 3
根據(jù)研究區(qū)植被生存狀態(tài),將研究區(qū)域內(nèi)的實驗植被類型設(shè)定為6種,分別為耕地、羊草、草甸、蒲草、沉水植被以及蘆葦,并根據(jù)實驗需要準(zhǔn)備了該6種濕地植被的光譜數(shù)據(jù)。因為水體的光譜反射特性,所以其在影像數(shù)據(jù)上是很好區(qū)分識別,就沒有單獨(dú)設(shè)定水體類別。如圖2所示。
圖2中從a到f曲線依次為草甸、羊草、耕地、蘆葦、蒲草以及沉水植被的光譜曲線。
1.2.1數(shù)據(jù)預(yù)處理
根據(jù)研究實驗的需要,依照搜集的參考資料對取得的原始高分辨率遙感圖像資料進(jìn)行預(yù)處理實踐:影像幾何校正,遙感圖像的增強(qiáng)以及遙感影像大氣校正處理。幾何校正的目的是完成遙感影像的地理編碼,讓影像與同一地區(qū)的地形圖等一些數(shù)據(jù)一致。利用ENVI5.0軟件對實驗數(shù)據(jù)(資源三號衛(wèi)星影像)進(jìn)行幾何精校正,糾正方法是二次多項式方法,選取了較均勻的30個控制點,投影為WGS84/UTM,RMSE為0.59。采樣用的方法是最臨近像元法,這是為了更好的降低光譜信息在實驗過程中發(fā)生的變化。大氣糾正是為了消除影像在拍攝過程中不可避免的大氣折射以及大氣散射等情況產(chǎn)生的噪聲,從而有效的提高地物提取的精確程度[4]。本實驗采用快速大氣校正(QUAC)工具,來完成大氣校正實驗。處理結(jié)果如圖3所示。
圖2 六種分類植被光譜曲線對比圖 Fig.2 Comparison chart of six kinds of classification of vegetation spectral curve
圖3 影像大氣校正前后的對比圖 Fig.3 Image contrast before and after atmospheric correction
接下來需要進(jìn)行圖像的融合、圖像鑲嵌和裁剪處理實驗。根據(jù)實驗研究的需要,我們采用了地理坐標(biāo)鑲嵌,鑲嵌的目的是為了將有一個或多個地理參考的衛(wèi)星遙感影像拼接起來,成為一個整體的圖像,鑲嵌可以隱藏或者淡化其原始衛(wèi)星遙感影像間的相互接縫現(xiàn)象。最后使用ENVI遙感影像處理軟件對高光譜遙感圖像進(jìn)行了不規(guī)則裁剪,得到我們需要的最終研究區(qū)域遙感影像[5]。實驗結(jié)果如圖4所示。
圖4 影像預(yù)處理前后對比效果 Fig.4 Image contrast before and after pretreatment
1.2.2樣本采集
通過采用天地圖以及谷歌地球等軟件,再結(jié)合目視解譯進(jìn)行樣本點提取作業(yè),確定實驗分類所需要的訓(xùn)練樣本以及檢驗樣本,從而來避免樣本重復(fù)。對不同植被地物獲取相近的檢驗和訓(xùn)練樣本,并盡量保持各類別的樣本分布均勻。見表1。
表2 訓(xùn)練樣本與檢驗樣本采集表 Tab.2 The training samples and test samples
最后計算樣本分離性,得出各類別分離性良好。
1.2.3最大似然法和支持向量機(jī)分類方法
最大似然法和支持向量機(jī)分類方法是遙感影像分類實驗中比較常用和特點鮮明的分類方法,本研究使用ENVI5.0軟件,采用這兩種方法對遙感影像數(shù)據(jù)進(jìn)行分類實驗。
監(jiān)督分類的方法中的最大似然分類方法是常用的一種遙感影像分類實驗處理方法,在分類的過程中通過計算每個像元所對于每個分類的概率,從而將待分類的像元劃到最大概率的那類像元里去,實現(xiàn)實驗?zāi)康摹W畲笏迫环ㄍㄟ^假設(shè)訓(xùn)練區(qū)所得的全部樣本的光譜特性來算出總體的先驗概率密度函數(shù),這與自然界中大部分的隨機(jī)現(xiàn)象是相類似,它們都大致服從于正態(tài)分布[6]。那么實驗分析中所需要的方差、協(xié)方差、平均值特征參數(shù)就可以通過建立先驗概率密度函數(shù)來獲取了。最大似然法分類結(jié)果如圖5所示。通過最大似然法的特征,在試驗中發(fā)現(xiàn)如果總體樣本的光譜特征不是正態(tài)分布,那么最大似然法的分類效果就會顯得不是很精確和穩(wěn)定,那么就可能需要其他分類方法來解決這類問題[7]。
最大似然法的待分像元?dú)w屬類別劃分為:設(shè)把某實驗研究中需要的遙感影像將之劃分成N類,Wη代表類別,其中η=1,2,...,N,待分類像元x屬于其中某一種類別的概率計算公式為:
P(Wη|x),η=1,2,...,N。
(1)
那么x屬于其中某一種類別的判別規(guī)則方法為:
?j(j≠η)當(dāng)P(Wη|x)>P(Wj|x)x∈Wη。
(2)
圖5 最大似然法分類結(jié)果 Fig.5 Classification results by maximum likelihood method
支持向量機(jī)(SVM)分類方法是由Vapnik和他的同事們于1995年期間發(fā)明提出的一種新的研究學(xué)習(xí)遙感影像分類的處理方法,該圖像分類觀點是通過研究分析在統(tǒng)計學(xué)習(xí)理論中獲得的VC維理論和結(jié)構(gòu)風(fēng)險最小理論原理得出的成果建立的。該方法是要根據(jù)對特定訓(xùn)練樣本的學(xué)習(xí)精度再加上不能有錯誤的識別任何樣本的能力二者之間相互輔助至最佳折中處理,以至來取得更好的處理實驗的結(jié)果。SVM分類結(jié)果如圖6所示。SVM(支持向量機(jī))最大的優(yōu)勢是進(jìn)行遙感影像分類計算處理時,它不需要進(jìn)行數(shù)據(jù)的降維處理,尤其在算法的訓(xùn)練速度、收斂性以及分類精度等一些方面都具有不錯的性能[8]。
構(gòu)造一個超平面作為其決策平面,從而使得正負(fù)模式期間空白至最大限度,是支持向量機(jī)用于識別分類模式的基本思路方式。那么該超平面為:
f·z+b=0。
(3)
式中:f是N維向量;z為樣本;b為偏移量。
那在線性可分的條件下,最優(yōu)的超平面可計算:
yi(f·z+b)≥1i=1,2,...N。
(4)
之后通過求最優(yōu)解以及在分類間隔最大化目標(biāo)函數(shù)的條件下,得出支持向量機(jī)的分類函數(shù)
(5)
式中:?是Lagrange乘子;b*是代表最優(yōu)超平面的偏移量。
圖6 支持向量機(jī)分類方法結(jié)果 Fig.6 Classification results by support vector machine(SVM)
1.2.4光譜角填圖分類(SAM)
監(jiān)督分類算法中光譜角填圖(Spectral Angle Mapping,SAM)是其中比較有效的分類算法之一,該算法的特點是可以直接將高光譜遙感影像中目標(biāo)像元的波普與參考波普兩者進(jìn)行交互式的匹配,其中涉及的參考波普可以是野外實地測量測的地物波普數(shù)據(jù),也可以是地物波普庫中的地物波普數(shù)據(jù)。運(yùn)用SAM分類方法通過測試光譜(測量高光譜遙感影像中某一像元的光譜數(shù)據(jù))與參考光譜之間的N維“角度”來判斷差異性以及其相似性。該分類方法通過計算出遙感影像中每一個像元的矢量以及參考光譜矢量間的廣義的夾角,來進(jìn)行計算分類,夾角越小導(dǎo)致相似度會越大,如果其小于某個設(shè)定的閾值時時,那么會把目標(biāo)像元?dú)w類到相應(yīng)的參考光譜代表的地物類型中[9]。
測試光譜與參考光譜間夾角的計算公式為:
(6)
式中:tj為測試光譜;rj為參考光譜;np為波段數(shù)。
通過SAM分類方法的特點,可以看出該方法在判定兩個光譜特征之間相似性時候,受實際的地形的因素干擾較小,有利于我們實驗研究。SAM分類方法下對濕地研究區(qū)進(jìn)行分類的過程,首先要把獲取的野外采集的地物光譜當(dāng)作端元光譜實驗。由于影像中的光譜分辨率一般情況下要低于實際測的光譜或者光譜數(shù)據(jù)庫中光譜,那么就需要對端元光譜進(jìn)行重采樣,這樣就可以使影像中待分類像元的光譜與端元光譜分辨率相互一致了。之后低通平滑處理待分類像元的光譜曲線,再之后分別的求出端元光譜曲線以及待分像元光譜曲線的n階導(dǎo)數(shù)。接下來要計算影像中待分類像元的光譜矢量與端元光譜的矢量之間的夾角,來評價對應(yīng)地物類型光譜矢量的相似性的高低程度,通過公式(6)計算出a表示為兩光譜矢量之間的夾角,其值域為0~π/2,結(jié)果當(dāng)a=0時表示兩光譜具有完全相似性,結(jié)果當(dāng)a=π/2時則表示兩光譜是完全不一樣的。最后通過計算影像中每個像元與每個端元光譜的aj,來對影像中每個像元進(jìn)行分類計算[10]。光譜角填圖結(jié)果如圖7所示。
圖7 光譜角填圖法分類結(jié)果 Fig.7 Classification results by spectral angle mapping method
2分類精度評價
本文對不同分類方法的結(jié)果,通過建立誤差矩陣獲取的總體精度和 Kappa 系數(shù)兩方面進(jìn)行精度的評價??傮w分類精度是表示所有正確分類的采樣點數(shù)值與全部采樣點的數(shù)值兩者之間的比值。Kappa 系數(shù)作為一個客觀的指標(biāo),是通過采用一種離散的多源技術(shù)來與總體分類精度互補(bǔ),我們需要使用這兩項數(shù)據(jù)相互輔助分析進(jìn)行影像分類精度評價[11]??傻贸鲆韵聰?shù)據(jù):
最大似然法分類總體精度=76.68%,Kappa系數(shù)=0.716。
SVM分類總體精度=79.73%,Kappa系數(shù)=0.778。
光譜角填圖法分類總體精度=89.87%,Kappa系數(shù)=0.880 7。
表3 最大似然法分類誤差矩陣 Tab.3 Classification error matrix of maximum likelihood method
表4 支持向量機(jī)分類誤差矩陣 Tab.4 Classification error matrix of support vector machine(SVM)
表5 光譜角填圖法分類誤差矩陣 Tab.5 Classification error matrix of spectral angle mapping method
通過對比表3、表4和表5數(shù)據(jù)可以得出結(jié)論:在實驗研究的三種分類方法中,最大似然法的總體分類精度和 Kappa 系數(shù)是最低的。通過分析,得出原因可能是因為樣本的光譜特征對比于正態(tài)分布存在一定的偏差,從而導(dǎo)致了這一結(jié)果。從數(shù)據(jù)中我們發(fā)現(xiàn)SVM分類法中把有較多蒲草錯分到了蘆葦類別,但是該分類方法的總體精度較高,達(dá)到了 79.73%(Kappa系數(shù)為0.778);光譜角填圖法的總體分類精度為 89.86%(Kappa 系數(shù)為0.881 7),得到的數(shù)據(jù)優(yōu)于其他兩種監(jiān)督分類計算方法的精度,分類效果也好于其他兩種分類方法。
3結(jié)論
本文在遙感影像分析研究扎龍濕地主要植被類型的過程中,創(chuàng)新運(yùn)用了三種方法進(jìn)行研究以保證試驗的全面性與科學(xué)性,這三種方法分別是:最大似然法,支持向量機(jī)(SVM)以及光譜角填圖分類方法。主要植被類型高光譜數(shù)據(jù)在扎龍濕地中的實地采集以及其中穿插銜接起的資源三號遙感衛(wèi)星提供的CCD影像和高光譜影像,再加上科學(xué)方法相輔相成共同促成了試驗的順利進(jìn)行[12]。從試驗中得出了明確的結(jié)論:光譜角填圖法較其他兩種方法優(yōu)勢明顯,原因在于考慮到野外實地考察中地形的復(fù)雜性及其他不可抗因素所造成的誤差,光譜角填圖法巧妙地將端元光譜(及參照光譜)設(shè)定為實地采集的各種植被類型,在此基礎(chǔ)上與高光譜影像中的待分項元進(jìn)行角度匹配,這就保證了試驗的目的明確性及最小誤差。從數(shù)據(jù)分析上,總體精度和Kappa系數(shù)分別為89.87%和0.880 7,同樣明顯的高于最大似然法和SVM分類方法處理的結(jié)果。
由于部分技術(shù)方面因素,現(xiàn)高光譜傳感器所提供出的波段數(shù)分段不夠明顯、圖片質(zhì)量也并未完全達(dá)到要求,這樣的客觀因素導(dǎo)致了野外實地考察主要植被的類別數(shù)量不全面,進(jìn)而對于本文的繼續(xù)深入產(chǎn)生了一定局限及阻礙。但是隨著技術(shù)方面進(jìn)步,今后仍要對此類問題不斷跟進(jìn),在現(xiàn)有成果和不斷提供的新數(shù)據(jù)新資料基礎(chǔ)上,取得更有實際意義甚至是里程碑式的進(jìn)步。
【參考文獻(xiàn)】
[1]駱劍承,周成虎,梁怡,等.支撐向量機(jī)及其遙感影像空間特征提取和分類的應(yīng)用研究[J].遙感學(xué)報,2002,6(1):50-55.
[2]駱劍承,王欽敏,馬江洪,等.遙感圖像最大似然分類方法的EM改進(jìn)算法[J].測繪學(xué)報.2002,31(3):234~239.
[3]王延飛,溫小榮,周蔚.濕地覆被的幾種遙感監(jiān)督分類方法比較——以江蘇鹽城濕地珍禽國家級自然保護(hù)區(qū)核心區(qū)為例[J].林業(yè)實用技術(shù),2012(2):62-64.
[4]衣偉宏,楊柳,張正祥.基于 ETM+影像的扎龍濕地遙感分類研究[J].濕地科學(xué),2004,2(3):208-212.
[5]王慶,廖靜娟.基于 LandsatTM 和 ENVISAT ASAR 數(shù)據(jù)的鄱陽湖濕地植被生物量的反演[J].地球信息科學(xué)學(xué)報,2010,2(12):282-291.
[6]張良培,張立福.高光譜遙感[M].武漢:武漢大學(xué)出版社.2005:32-35.
[7]宮鵬,牛振國,程曉,等.中國1990 和 2000 基準(zhǔn)年濕地變化遙感[J].中國科學(xué):地球科學(xué),2010,40(6):768-775.
[8]李慧.基于多源遙感數(shù)據(jù)的濕地信息提取及景觀格局研究[D].福州:福建師范大學(xué),2005.
[9]Bronge L B,Naslund-Landenmark B.Wetland classification for Swedish C-ORINE land cover adopting a semi-automatic interactive approach[J].Canadian Jounral of Remote Sensing,2002,28(2):139-155.
[10]Dissanska M.Object-based classification of very high resolution panchrom-atic images for evaluating recent change in the structure of patterned peatlands[J].Canadian Journal of Remote Sensing,2009,32(2):189-215.
[11]Baker C,Lawrence R.Mapping wetlands and riparian areas using Landsat ETM+ imagery and decision-tree-based models[J].The Society of Wetland Scientist,2006,26(2):465-474.
[12]Wilson M A,Capenter S R.Economic valuation of freshwater ecosystem services in the United States:1971-1997[J].Ecological Application,1999,9(3):772-783.
[責(zé)任編輯:劉美爽]