李雨秦, 左小清, 李洪忠
(1.昆明理工大學(xué) 國土資源工程學(xué)院, 云南 昆明 650500;2.深圳先進(jìn)技術(shù)研究院 數(shù)字所空間信息中心, 廣東 深圳 518000)
紅樹林生長于潮間帶,構(gòu)建了一種過渡性的特殊生態(tài)系統(tǒng),成為連接陸地和海洋的重要媒介。紅樹植物屬于根系發(fā)達(dá)的木本植物,具有一定的耐鹽力,能在海水中生長,不僅可以凈化水體,有效減少赤潮等水污染的發(fā)生,還抗風(fēng)固土,減少潮波、風(fēng)暴潮和海嘯造成的海岸線侵蝕,可以有效抵御風(fēng)浪襲擊。然而隨著環(huán)境惡化與不當(dāng)開發(fā),全球紅樹林面積急劇下降,我國紅樹林的情況更不容樂觀。從20世紀(jì)50年代的420 km2,到21世紀(jì)初僅剩220 km2,不及世界紅樹林面積的千分之一,因此保護(hù)紅樹林迫在眉睫,任重道遠(yuǎn)[1-4]。
為了完成紅樹林的可持續(xù)保護(hù),需要更好地監(jiān)測紅樹林的演替、分布等動(dòng)態(tài)信息和結(jié)構(gòu),因此需要迅速和精準(zhǔn)地繪圖,遙感技術(shù)的發(fā)展為滿足這一需求提供了可能。遙感的分類精度主要受兩個(gè)因素的影響,一個(gè)是不同類別間邊緣像元的數(shù)目,另一個(gè)是同一類別內(nèi)部的光譜特征變異[5-6]。為了獲得更好的分類結(jié)果,便需要根據(jù)地物的實(shí)際情況,在這二者的相互作用中尋找達(dá)到平衡的空間尺度。許多學(xué)者通過對于可分性度量的研究,進(jìn)一步探究影像分類的最佳分辨率[7]。王秋玲等[8]基于CBERS-02B與資源三號衛(wèi)星(ZY-3)的多光譜影像數(shù)據(jù),采用J-M距離方法探討分析了江蘇省徐州市郊區(qū)的光譜可分性。徐軍等[9]以變換離散度為指標(biāo),基于環(huán)境一號(HJ-1A/1B星)CCD多光譜掃描相機(jī)成像數(shù)據(jù),對其典型地物可分性進(jìn)行分析,并得出各波段在典型地物的區(qū)分度。錢軍朝等[10]以WorldView-2為數(shù)據(jù)源,以杭州市西湖區(qū)為研究區(qū)域,結(jié)合J-M距離確定紋理計(jì)算的最佳窗口,結(jié)果顯示采用該方法篩選紋理特征可以極大地提高實(shí)驗(yàn)結(jié)果的精度和效率。章志等[11]基于OLI影像,采用J-M距離優(yōu)化不同波段組合,進(jìn)一步篩選出該研究區(qū)的最佳波段組合。
紅樹林種群分類對遙感數(shù)據(jù)源要求較高,需具有較高的空間分辨率和光譜分辨率[12-14]。然而數(shù)據(jù)的分辨率越高,其價(jià)格以及所花費(fèi)的時(shí)間、空間成本越高。此外,研究證明,并非分辨率越高,分類結(jié)果的精度就會(huì)越高[7,15]。多種分辨率的影像都可以用于紅樹林的種群分類,因此在做分類研究時(shí),需要考慮空間分辨率對分類結(jié)果的影響,這樣才能避免數(shù)據(jù)選擇時(shí)的盲目性,也在一定程度上降低了成本。本文以深圳灣的紅樹林群落為例,分別計(jì)算2、4、8、16 m的WorldView-2多光譜數(shù)據(jù)(其中4、8、16 m由2 m WorldView-2數(shù)據(jù)重采樣獲得)的J-M距離和變換離散度,通過不同分辨率下不同類別間J-M距離和變換離散度異同的分析,并用相應(yīng)分辨率影像的真實(shí)分類結(jié)果節(jié)進(jìn)行驗(yàn)證,探究J-M距離和變換離散度這兩個(gè)統(tǒng)計(jì)可分性的度量在紅樹林種群分類研究中對于空間分辨率選擇的參考價(jià)值。
研究區(qū)為深圳灣紅樹林自然保護(hù)區(qū),坐落于深圳灣北東岸深圳河口的紅樹林鳥類自然保護(hù)區(qū)之中(圖1),包括米埔自然保護(hù)區(qū)(位于香港)和福田自然保護(hù)區(qū)(位于深圳)。該區(qū)域年平均氣溫23 ℃,年均降雨量1700~1900 mm,土壤基質(zhì)為花崗巖以及砂頁巖,是一塊極具生態(tài)價(jià)值的濕地。研究區(qū)內(nèi)主要包括6種紅樹林的優(yōu)勢樹種,即秋茄(Kandelia Obovata,KO)、海桑(Sonneratia Caseolaris,SC)、桐花樹(Aegiceras Corniculatum,AC)、老鼠簕(Acanthus Ilicifolius,AI)、無瓣海桑(Sonneratia Apetala,SA)和白骨壤(Avicennia Marina,AM)[16]。其中秋茄、桐花樹、老鼠簕和白骨壤為本土物種,海桑和無瓣海桑為外來物種[17-18]。
(a) 研究區(qū)紅樹林分布 (b) 研究區(qū)地理位置圖1 研究區(qū)位置示意圖(取自谷歌地球)
本研究的數(shù)據(jù)源為WorldView-2的分辨率為2 m的多光譜影像數(shù)據(jù)。2009年10月6日,WorldView-2衛(wèi)星發(fā)射升空,運(yùn)行在770 km高的太陽同步軌道上,平均回訪周期為1.1 d,波段參數(shù)如表1所示。本實(shí)驗(yàn)所使用的影像數(shù)據(jù)主要進(jìn)行了輻射校正、幾何校正等預(yù)處理工作,均利用ENVI5.3中預(yù)處理工具進(jìn)行。
表1 worldview-2數(shù)據(jù)參數(shù)
本文基于WorldView-2的多光譜數(shù)據(jù),通過最臨近法重采樣獲得4、8、16 m的影像數(shù)據(jù)(通過ENVI5.3實(shí)現(xiàn))。在實(shí)地調(diào)研與目視解譯的基礎(chǔ)上選擇樣本點(diǎn),分別計(jì)算不同類別樣本點(diǎn)間的J-M距離和變換離散度。為避免不同采樣導(dǎo)致的誤差,每個(gè)樣本點(diǎn)均為在不同分辨率的影像上分別生成的矢量點(diǎn),對比二者隨著空間尺度的不同而產(chǎn)生變化的異同,按大約3∶1比例將樣本點(diǎn)分為兩類,分別作為建立紅樹林樹種分類的訓(xùn)練樣本和驗(yàn)證樣本來訓(xùn)練隨機(jī)森林分類器,將最終結(jié)果與J-M距離和變換離散度對可分性的度量結(jié)果相比較,旨在以真實(shí)的分類結(jié)果驗(yàn)證分析在紅樹林種群分類研究中,若J-M距離和變換離散度對于類別可分性的度量產(chǎn)生差異,哪個(gè)更具參考意義。
遙感圖像分類中,類對間的可分性會(huì)受影像空間分辨率的影響。一直以來,在地表特征可分性的判定方法中,J-M距離(Jeffreys-Matusita distance)[19-20]和變換離散度(Transformed Divergence)[21-23]是最常用的兩種度量。
2.1.1 J-M距離
J-M距離是一種光譜可分性的度量指標(biāo),它基于條件概率理論,對遙感數(shù)據(jù)的分布形式要求低,因此具體有較好的通用性。
具體計(jì)算公式為[21]
J-M距離的大小在0~2之間,并且隨類別之間可分離程度的大小而變化,其大小代表樣本間可分離程度的高度。式(1)中,當(dāng)0 2.1.2 變換離散度 離散度(Divergence)是模式識別中早期采用的統(tǒng)計(jì)可分性度量之一,計(jì)算公式為[7,12-13] 其中Dij為類別i和類別j之間的離散度,Ci和Cj為類別i和j的協(xié)方差矩陣,μi和μj為類別i和j的平均矢量。 然而,當(dāng)離散度達(dá)到一定程度后,其與正確分類的概率缺乏對應(yīng)關(guān)系。因此,引入一個(gè)負(fù)指數(shù)項(xiàng)對離散度進(jìn)行優(yōu)化,使其變?yōu)橐粋€(gè)飽和的統(tǒng)計(jì)可分性度量,稱變換離散度[12-13]。對于兩個(gè)類別i和j,它們之間的變換離散度函數(shù)如下[24]: 隨機(jī)森林(Random Forest,簡稱RF),是一種將多顆決策樹集成的算法,它由Leo Breiman和Adele Cutler于1995年提出[25]。隨機(jī)森林以決策樹為基本單位,通過決策樹的投票來決定最后的分類結(jié)果。它重視各個(gè)特征在分類問題上的重要性,可以有效減少?zèng)Q策樹過擬合的不足,提升泛化能力,能夠有效地運(yùn)用在大數(shù)據(jù)集上,不需要對高維特征的輸入樣本進(jìn)行降維,對部分特征缺失不敏感,且具有極好的準(zhǔn)確率。本研究使用了ENVI拓展隨機(jī)森林工具[26](源碼來源于ENMAP-BOX v2.1.1并對其進(jìn)行封裝,方便在ENVI下使用),選用基尼系數(shù)作為節(jié)點(diǎn)特征選取的判定標(biāo)準(zhǔn),通過計(jì)算平方根確定每個(gè)節(jié)點(diǎn)備選特征的數(shù)量,設(shè)置100棵樹進(jìn)行投票,確定最終結(jié)果。Romie Jhonnerie等[27]曾基于Landsat 5 TM和ALOS PALSAR圖像,采用隨機(jī)森林分類法對紅樹林植被進(jìn)行分類,結(jié)果顯示,隨機(jī)森林分類器總體精度及Kappa系數(shù)分別為81.1%和0.76,優(yōu)于最大似然分類器分類結(jié)果的精度。 本文使用驗(yàn)證樣本對于每種分類結(jié)果建立混淆矩陣,根據(jù)總體精度、Kappa系數(shù)、生產(chǎn)者精度和用戶精度,進(jìn)行分類精度的評價(jià)。 圖2為6類紅樹林種群的J-M距離隨空間分辨率產(chǎn)生的變化,圖3為變換離散度隨空間分辨率產(chǎn)生的變化。圖中的AC、AM、AI、KO、SA、SC分別代表桐花樹(Aegiceras Corniculatum)、白骨壤(Avicennia Marina)、老鼠簕(Acanthus Ilicifolius)、秋茄(Kandelia Obovata)、無瓣海桑(Sonneratia Apetala)以及海桑(Sonneratia Caseolaris),為了清晰表示,將每張圖分為3個(gè)圖顯示。 圖2 不同種群之間J-M距離隨空間分辨率的變化 圖3 不同種群之間變換離散度隨空間分辨率的變化 由圖2可以看出,在這4種分辨率的比較中,各類別之間的最低值均出現(xiàn)在16 m。但不同類別間的J-M距離隨空間分辨率產(chǎn)生的變化并不完全相同,有的峰值點(diǎn)出現(xiàn)在2 m(5個(gè),如桐花樹和海桑(AC-SC)),有的峰值點(diǎn)出現(xiàn)在4 m(9個(gè),如桐花樹和老鼠簕(AC-AI)),有的峰值點(diǎn)出現(xiàn)在8 m(1個(gè),無瓣海桑和海桑(SA-SC))。 總體趨勢基本可以分為3種:(1)隨著分辨率降低,J-M距離幾乎不變,呈現(xiàn)這種趨勢的類別之間的J-M距離普遍較高,可分性較強(qiáng),并且?guī)缀醪皇苡跋穹直媛实挠绊?,因此?yīng)該沒有或極少有鄰接區(qū)域,例如桐花樹和海桑(AC-SC);(2)隨著分辨率降低,J-M距離逐漸降低,呈現(xiàn)這種趨勢的類別在空間位置上一般相鄰,鄰接區(qū)域較多或內(nèi)部光譜差異較小,因此隨著分辨率降低,邊緣混合像元增加的速度遠(yuǎn)遠(yuǎn)大于類內(nèi)光譜變異程度的減小,例如老鼠簕和秋茄(AI-KO)、白骨壤和秋茄(AM-KO);(3)隨著分辨率降低,J-M距離先升高后降低,呈現(xiàn)這種趨勢的類別在到達(dá)最高點(diǎn)以前,類內(nèi)光譜變異程度減小的積極影響強(qiáng)于混合像元數(shù)量增加的消極影響,隨著分辨率的降低,二者相互影響,在峰值以后,由于類內(nèi)光譜變異程度減小到一定程度后趨于穩(wěn)定,而混合像元?jiǎng)t不斷增加,因此開始降低,例如桐花樹和秋茄(AC-KO)、老鼠簕和白骨壤(AI-AM)。 將圖3與圖2進(jìn)行對比,可以看出,在這4種分辨率的比較中,類別間的變換離散度與J-M距離相比較,波動(dòng)范圍較小,顯示出更好的可分性。除了出現(xiàn)的3種趨勢的分布略有不同外,變換離散度還出現(xiàn)了一種先減小后增大的趨勢。無瓣海桑和海桑(SA-SC)的J-M距離隨著分辨率的減小,先升高后降低,變換離散度則隨著分辨率的減小,先降低,后升高,再次降低。兩種波動(dòng)趨勢雖不完全一致,但相比較其他類別對,波動(dòng)均更為劇烈,二者的邊緣混合像元的數(shù)目與類內(nèi)光譜變異程度產(chǎn)生了較為復(fù)雜的相互作用,并且貢獻(xiàn)度相當(dāng),因此該研究區(qū)內(nèi)的無瓣海桑與海桑應(yīng)同時(shí)具有一定數(shù)量的單一群落和共生群落。而且,它們同屬于海??坪I?,葉對生,葉面形狀為橢圓形至長橢圓形,厚革質(zhì),有著極為相似的冠層紋理特征[10],這也成為二者易混淆的原因之一。 圖4 不同種群之間平均J-M距離和平均變換離散度隨空間分辨率的變化 通過比較不同種群之間平均J-M距離和平均變換離散度隨空間分辨率的變化(圖4),結(jié)果表明:(1)在影像的空間分辨率一致的條件下,針對紅樹林的種群分類,類別間的平均J-M距離和平均變換離散度的大體趨勢基本一致,但是峰值點(diǎn)位置不同;(2)并非對于所有類別都是分辨率越高,類別對間的可分性就越好;(3)平均J-M距離和平均變換離散度的整體趨勢基本一致,但是平均J-M距離的峰值點(diǎn)出現(xiàn)在分辨率為4 m的時(shí)候,而平均變換離散度的峰值點(diǎn)出現(xiàn)在分辨率為8 m處。并且不同分辨率的平均J-M距離的值均低于平均變換離散度的值,因此對于該區(qū)域的紅樹林種群分類,若以平均J-M距離為參考,4 m的空間分辨率為最佳選擇;若以平均變換離散度為參考,8 m的空間分辨率為最佳選擇。 圖5為不同空間分辨率影像采用隨機(jī)森林分類法的分類結(jié)果對比。對群落分布結(jié)果進(jìn)行目視解譯,可以發(fā)現(xiàn)6種紅樹林種群的分布特征基本一致,均與實(shí)際地物大致符合。 圖5 不同空間分辨率的分類結(jié)果 從圖5中可以看出,隨著分辨率的降低,斑塊的破碎程度逐漸減小。研究區(qū)西北部主要為海桑的單一群落,其中夾雜部分桐花樹、白骨壤和秋茄,沿東南方向,桐花樹和秋茄數(shù)目不斷增多,于中部出現(xiàn)了無瓣海桑的單一群落集,沿海地區(qū)則大量分布著海桑和無瓣海桑的混生群落,老鼠簕和白骨壤零星地分布于秋茄和桐花樹之間,極少分布于沿海區(qū)域。 分類結(jié)果中,分辨率為4 m的影像數(shù)據(jù)表現(xiàn)最佳:總體精度為77.333 3%,Kappa系數(shù)為0.726 2;當(dāng)分辨率為2 m時(shí),總體精度為70.666 7%,Kappa系數(shù)為0.645 8;當(dāng)分辨率為8 m時(shí)的總體精度為73.333 3%,Kappa系數(shù)為0.677 8;當(dāng)分辨率為16 m時(shí),總體精度將至58.666 7%,Kappa系數(shù)降為0.497 9。說明在深圳灣紅樹林種群分類中,相比2、8、16 m分辨率的影像數(shù)據(jù),采用4 m分辨率的影像數(shù)據(jù)可以獲得更高的分類精度(見圖6)。 圖6 總體精度與Kappa系數(shù)隨空間分辨率的變化 使用2 m分辨率的影像時(shí),桐花樹的生產(chǎn)者精度和用戶精度最高,海桑的生產(chǎn)者精度和用戶精度最低,較多的無瓣海桑被錯(cuò)分為了海桑。在使用4、8、16 m分辨率的影像時(shí),秋茄的生產(chǎn)者精度和用戶精度最高,無瓣海桑的生產(chǎn)者精度最低,白骨壤的用戶精度最低。研究區(qū)內(nèi)秋茄和桐花樹分布最廣,具有大量的單一群落,這導(dǎo)致二者具有較高的分類精度。而白骨壤分布隨機(jī)、分散且樣本數(shù)量較少,混生群落較多,生長邊界很不清晰,這些都為識別增加了難度。 結(jié)果表明:(1)分類精度的高低并非與分辨率的高低成正比。就總體精度而言,針對紅樹林的種群分類,4 m分辨率的分類結(jié)果>8 m分辨率的分類結(jié)果>2 m分辨率的分類結(jié)果>16 m分辨率的分類結(jié)果。隨著光譜分辨率的不同,不同類別邊緣的混合像元數(shù)目與地物內(nèi)部的光譜特征變異不斷變化,而最終分類精度的變化則是二者共同影響的結(jié)果。因此對于最優(yōu)空間尺度的選擇需要考慮地物之間的相對關(guān)系,降低選擇影像數(shù)據(jù)的盲目性。(2)紅樹林種群分類的實(shí)際結(jié)果與平均J-M距離所呈現(xiàn)的結(jié)果更為相符,即4 m的空間分辨率為最佳此研究區(qū)內(nèi)紅樹林種群分類的最佳選擇。因此,在該區(qū)域的紅樹林種群分類研究中,相較變換分離度,J-M距離更具參考價(jià)值。 J-M距離與變換分離度均可度量類別間的可分性,然而在二者產(chǎn)生差異時(shí),如何確定哪一個(gè)更具可靠性。本文采用用實(shí)際影像數(shù)據(jù)的分類結(jié)果與二者對于可分性的度量進(jìn)行驗(yàn)證的方法,通過計(jì)算2、4、8、16 m共4個(gè)空間尺度上的J-M距離和變換離散度,分析了6種深圳灣紅樹林優(yōu)勢種群隨著空間分辨率的變化而產(chǎn)生的可分性的變化,并通過隨機(jī)森林分類法,采用相同的樣本點(diǎn)進(jìn)行分類,并將分類結(jié)果與統(tǒng)計(jì)可分性相比較。結(jié)果顯示:(1)隨著空間分辨率的變化,不同類別間的可分性呈現(xiàn)不同的變化規(guī)律;(2)類別間的可分性差異體現(xiàn)了其空間關(guān)系上的差異;(3)分類結(jié)果的總體精度與J-M距離對可分性的度量結(jié)果更為一致,驗(yàn)證了在紅樹林種群分類研究中,相比變換分離度,J-M距離對于可分性的度量更具參考意義。2.2 分類方法
2.3 精度評價(jià)
3 結(jié)果與討論
3.1 不同分辨率的可分性統(tǒng)計(jì)結(jié)果分析
3.2 不同分辨率種群分類結(jié)果比較
4 總 結(jié)