劉懷鵬 安慧君
(內蒙古農業(yè)大學,呼和浩特,010019)
利用最大似然法識別呼和浩特市綠化樹種1)
劉懷鵬 安慧君
(內蒙古農業(yè)大學,呼和浩特,010019)
以呼和浩特市的WorldView-Ⅱ為數據源,通過影像光譜特征分析,篩選出有利于樹種識別的波段,利用最大似然法對影像進行分類。結果表明:11個樹種及草類在海岸、藍、綠、黃色波段中可分性不大,在紅、紅色邊緣、近紅外1、近紅外2波段中可分性較大;11個樹種及草類的整體分類精度可達62.93%,Kappa系數為0.584 2,表明分類結果與實際情況具有中等的一致性;樹種組分類中,分類的總體精度為72.59%,Kappa系數為0.657 1,表明分類結果與影像真實情況具有高度的一致性。
WorldView-Ⅱ;呼和浩特市;光譜特征分析;最大似然法
Journal of Northeast Forestry University.-2014,42(7).-157~160,169
With Huhhot WorldView-Ⅱ images as the data source, we analyzed the image spectrum feature and screened the band conducive to classification to classify the image by maximum likelihood. The separability of all the trees and grasses in coast, blue, green and yellow bands is not very obviously. In red, red edge, near infrared 1 and 2 bands, the separability is very obviously. The overall accuracy of tree species classification is about 62.93%, Kappa coefficient is 0.584 2, and the classification with the actual situation has medium consistency. The overall accuracy of tree species groups classification is 72.59%, Kappa coefficient is 0.657 1, and the classification with the actual situation has high consistency.
Keywords WorldView-Ⅱ; Huhhot; Spectrum feature analysis; Maximum likelihood
隨著中國經濟的快速發(fā)展,城市化進程不斷加快,城市綠化樹種種類不斷豐富,如北京的綠化樹種130多種、上海500種左右、沈陽482種、呼和浩特市30余種[1-3]。在呼和浩特市區(qū),油松、檜柏、樟子松、白杄4個針葉樹種占全部綠化針葉樹的91%,而垂柳、國槐、新疆楊、紫丁香、玫瑰、榆葉梅、連翹等9種落葉喬灌木占整個落葉樹種的76%[3]。綠化樹種的增加,對全面提升城市綠地系統(tǒng)的功能起到了十分重要的作用,但也給樹木種類的調查和統(tǒng)計等工作帶來了諸多不便和困難。隨著航天遙感技術的發(fā)展,高空間分辨率遙感數據不斷涌現,GeoEye-1(地球之眼1號衛(wèi)星)的分辨率達0.41 m、WorldView-Ⅱ(世界觀察2號衛(wèi)星)的分辨率達0.5 m、QuickBird(快鳥衛(wèi)星)的分辨率達0.6 m,這些高分辨率數據完全能分辨帶狀、片狀綠地,甚至單棵樹木。
在樹種識別方面最常用的數據為地面實測高光譜數據。宮鵬等[4]在樹種波譜測定的基礎上采用對數變換、一階微分變換、對數變換后一階微分變換、歸一化變換、歸一化變換后一階微分變換及歸一化后對數變換等處理,識別了糖松、美國西黃松、白冷杉、花旗松、香肖楠、加州黑櫟等6種針葉樹種,平均精度高達94%;王志輝等[5]研究香樟、麻櫟、馬尾松、毛竹4種樹種,分析不同樹種原始光譜、光譜一階微分和光譜二階微分曲線圖,從中選擇差異較大的波段用于鑒別不同樹種,最后利用歐氏距離對所選擇的波段檢驗識別不同樹種的效果,檢驗的結果顯示選擇的波段能有效地區(qū)分不同樹種;劉秀英等[6]利用地物光譜儀測量杉木、雪松、小葉樟樹、桂花等4個樹種的高光譜數據,采用逐步判別分析和分層聚類法對實驗數據進行分析,成功地識別出這幾個樹種,最高分類精度可達96.77%。在影像數據方面,韓凝等[7]基于1 m空間分辨率的IKONOS融合衛(wèi)星影像,采用面向對象的分類方法,充分利用多尺度分割逐級分層提取的優(yōu)勢,對香榧樹的分布進行信息提取,準確地確定香榧樹的空間分布位置(生產者精度為86.36%,用戶精度為67.86%),提取結果表明面向對象分類方法在香榧樹信息提取中顯示出巨大的潛力。周堅華等[8]在傳統(tǒng)植被分類描述符的基礎上引進基于波譜特征、紋理特征、形狀特征的新描述符,利用航片和這些描述符對城鎮(zhèn)12種綠化樹種進行了識別,誤分率僅為5.8%,較傳統(tǒng)的分色亮度組合(誤分率為25.9%)有明顯改進。
本文借鑒前人的經驗,以WorldView-Ⅱ為數據源,利用最大似然法對呼和浩特市的主要綠化樹種、綠化樹種組進行識別。
數據源為呼和浩特市建城區(qū)局部WorldView-Ⅱ影像,面積42 km2,成像時間為2011年8月31日,全色波段空間分辨率為0.5 m,多光譜(8波段)空間分辨率為2 m,經緯度范圍分別為111°39′12.65″~111°44′35.31″E,40°46′27.57″~40°49′35.04″N。
數據在本研究使用前經過輻射定標、Gram-Schmidt Spectral Sharpening融合(融合后的空間分辨率0.5 m)、快速大氣校正等預處理。
2.1 影像光譜特征
從影像上知,研究區(qū)范圍內的綠地主要分布于交通要道和片林區(qū),將有代表性的道路影像和片林影像裁剪、打印,用來進行實地調查。調查中,將實際調查樹種與草類,標記在打印出來的影像上,調查完成后再將樣本以ROI(感興趣區(qū))的形式對應到電子影像上。分布在街道上的樹種主要有國槐、新疆楊、榆樹、臭椿、垂柳、圓柏,小片林主要有油松、樟子松、白杄、杜松、草類,還有一些零星分布的丁香。根據調查樹種的數量確定以上11個樹種與草類為研究區(qū)光譜分析的目標植被類型。
在單木樹冠上選取訓練樣本,訓練樣本較為均勻地散布在研究區(qū)范圍內,每類選取200個ROI(約2 500個像元),統(tǒng)計各樹種及草類的反射值均值,擬合出各樹種及草類的反射值均值波譜曲線(圖1)。
從圖1中可以看出11個樹種及草類在海岸、藍、綠、黃波段中分散性不大,在紅、紅色邊緣、近紅外1、近紅外2波段中較為分散,最后將WorldView-Ⅱ數據由8個波段減少到只包含紅光波段、紅邊波段、近紅外1波段、近紅外2波段四個波段的數據。
反射率的范圍在[0,1]之間,大氣校正時考慮到數據儲存和后續(xù)處理,將得到的反射率乘以10 000變成16bit整型的反射值,圖中橫縱軸均無單位。
圖1 研究區(qū)各物種反射值均值波譜曲線圖
2.2 影像分類
樹種識別前,先制定從粗到細的影像分類分級結構。第一步將影像分為植被部分和非植被部分兩類;第二步將植被部分分為針葉樹、闊葉樹和草類;第三步嘗試將針葉樹、闊葉樹細分到樹種,分析細分到樹種時的精度情況,精度較低時考慮將光譜特征相近的樹種合并,以樹種組的形式進行第四步分類。
2.2.1 植被信息提取
研究表明,歸一化植被指數(NDVI)、簡單比值植被指數(SRI)、增強型植被指數(EVI)、大氣阻抗植被指數(ARVI)、花青素指數1(ARI1)、土壤調整植被指數(SAVI)6種植被指數對植被信息的提取精度可達99%(制圖精度),其中歸一化植被指數提取植被信息的精度最高[9]。本研究選取NDVI提取植被信息,以[0.269 716,0.758 209]為閾值范圍,建立掩膜,將影像分為植被部分與非植被部分兩類。
2.2.2 針葉樹、闊葉樹及草類的區(qū)分
最大似然分類法是根據Bayes準則對影像進行的分類,它是一種典型的基于統(tǒng)計分析的監(jiān)督分類器。設分類影像中有向量X=[x1,x2,…,xn],研究區(qū)可分為m類wi,i=1,2,…,m。根據Bayes公式,在X出現的條件下,其歸屬于第wi的歸屬概率為[10]:
(1)
式中:P(wi)表示先驗概率,即被分類影像中類別wi出現的概率;P(X/wi)為似然概率,表示在wi這一類中出現像元X的概率。
式(1)中P(wi)通常使通過各種先驗知識來確定,而分母與類別wi無關,在做判別時可以將其去掉。因此,只需求出P(X/wi)就可以得出歸屬概率,P(X/wi)由訓練樣本來確定其參數。假設訓練樣本數據在特征空間上的分布服從高斯正態(tài)分布,像素特征向量X在第wi類的條件概率密度函數為:
(2)
式中:μi和∑i分別表示第i類訓練樣本的均值向量和協(xié)方差矩陣,∑-1為∑的逆。
根據Bayes判別規(guī)則將像元歸為歸屬概率最大的那類,若P(wi/X)=max(P(w/X)),則X∈wi。
分類的準確程度用分類精度(生產者精度和用戶精度)、Kappa系數衡量。生產者精度表示地表真實像元中正確歸類像元的百分數;用戶精度反映了一個被分類像元能真實代表該地類的概率;Kappa系數用來評估分類結果圖與原始影像地表真實情況的一致性,能夠更加客觀的評價分類結果。
Kappa系數的范圍為[-1,1],但通常Kappa系數值落在[0,1],可分為五組來表示不同級別的一致性:[0,0.20]為極低的一致性;(0.20,0.40]為一般的一致性;(0.40,0.60]為中等的一致性;(0.60,0.80]為高度的一致性;(0.80,1]幾乎完全一致。
混淆矩陣中可以觀察分類結果的生產者精度、用戶精度和Kappa系數,所以分類結果用混淆矩陣進行統(tǒng)計分析。
對照野外實測樣本,在針葉樹、闊葉樹的單棵樹冠上繪出合適的ROI,對針葉樹、闊葉樹、草類,每類選取50個ROI樣本(隨機均散于影像),利用最大似然法進行分類。
3.1 針闊草分類精度
從野外實測樣本中選取合適的樣本作為精度驗證樣本(非分類樣本),分類精度(見表1)。從表1中可知,針葉樹、闊葉樹、草類的總體分類精度為93.99%;以生產者精度為例:針葉樹的精度為91.98%,最低;闊葉樹的精度為92.82%,居中;草類的精度為97.07%,最高;Kappa系數為0.909 8。表明分類結果與原始影像真實情況幾乎完全一致。
從表1可以看出,闊葉樹和針葉樹、草類均有互為誤分的情況,說明闊葉樹在光譜反射特征上與針葉樹和草類有相似的地方,但針葉樹與草類沒有互為誤分的現象,說明針葉樹與草類的反射特征差異大。
表1 針闊草分類精度統(tǒng)計表
3.2 樹種分類精度
以光譜特征分析中的樣本作為樹種分類的訓練樣本,分別采用傳統(tǒng)監(jiān)督分類中的最小距離、馬氏距離、平行六面體、波譜角、最大似然法對4波段WorldView-Ⅱ數據進行分類。發(fā)現其它方法分類精度與最大似然分類的精度相差很大,最大似然分類法的識別精度最高。因此,本研究采用最大似然分類法對油松、圓柏、樟子松、白杄、杜松、垂柳、國槐、新疆楊、丁香、榆樹、臭椿及草類進行分類。各樹種及草類分類結果如圖2所示。
圖2 樹種分類結果
分類后將野外采集到的11個樹種及草類的部分樣本(非分類樣本)作為精度驗證樣本,驗證樣本采集與訓練樣本采集方法相同,總共選取4 073個像元點進行驗證,11個樹種及草類的像元采集個數及精度驗證情況如表2所示。從表2中可以看出,樹種分類中,總體分類精度為62.93%,Kappa系數為0.584 2,表明分類圖與真實圖具有中等一致性。以生產者精度為例,該分類法對草類的識別精度最高,為90.66%;對樟子松、丁香、垂柳的分類精度分別為78.81%、74.51%、71.83%;對新疆楊、白杄、杜松的分類精度分別為69.60%、64.04%、60.20%;對國槐、油松、臭椿、圓柏、榆樹的識別精度在60%以下,比較低。分類精度大致呈現為草類最高、闊葉樹種次之、針葉樹種較低,但榆樹和樟子松反常較為明顯。對于分類精度低的樹種,可能的原因除了它們本身在光譜特征接近以外,還與它們的樹冠大小、配植方式、臨近樹種、林下木的影響有關。
表2 樹種分類精度統(tǒng)計表
3.3 樹種組分類精度
城市綠化樹木種類繁多,對單棵樹進行分類,大部分樹種的分類精度都比較低,所以考慮將光譜特征接近的樹種合并成樹種組,以樹種組的形式進行分類。根據圖1與表2,將闊葉樹中的國槐、垂柳、榆樹、臭椿合并為國槐組,將新疆楊、箭桿楊等楊樹稱為新疆楊組;將針葉樹中的油松、樟子松合并為油松組,將圓柏、白杄、杜松合并圓柏組;灌木中將不同類型的丁香、連翹歸并為丁香組;各種雜草歸為一類。分類結果如圖3所示。
圖3 樹種組分類結果圖
選取5 111個像元作為樹種組分類中的精度驗證樣本,每個樹種組精度驗證樣本數量大體相當,樹種組分類精度統(tǒng)計(見表3)。從表3可知,樹種組分類中,分類的總體精度為72.59%,Kappa系數為0.657 1,表明分類結果與影像真實情況具有高度的一致性。草類的精度(制圖精度)最高,達85.76%;新疆楊組次之,精度為74.36%;最低的是圓柏組,精度為63.50%,每個樹種組的分類精度都在60%以上。分為樹種組后,由于將光譜特征相近的樹種歸并為一類,分類精度較樹種識別有了較大的提高。
表3 樹種組分類精度統(tǒng)計表
基于遙感影像的綠化樹種識別是一個國際性的難題,研究綠化樹種的分類具有十分重要的意義。本文在11個綠化樹種及草類光譜特征分析的基礎上,篩選出4個光譜分散性較大的波段,進而用這4個波段進行樹種識別、樹種組分類。
11個樹種及草類在海岸、藍、綠、黃色波段中分可分性不大,在紅、紅色邊緣、近紅外1、近紅外2波段中可分性較大。
針葉樹、闊葉樹、草類分類中,總體分類精度為93.99%;針葉樹的精度為91.98%,,闊葉樹的精度為92.82%,草類的精度為97.07%;Kappa系數為0.909 8,表明分類結果與影像真實情況幾乎完全一致。
樹種識別中分類的總體精度為62.93%,Kappa系數為0.5842,表明分類結果與影像真實情況具有中等一致性。分類精度大致呈現為草類最高、闊葉樹種次之、針葉樹種最低。但闊葉樹種與針葉樹種精度的高低也存在反常情況,這可能與樹種的配植方式、分層結構、背景有關,還需進一步研究。
樹種組分類中,分類的總體精度為72.59%,Kappa系數為0.657 1,表明分類結果與影像真實情況具有高度的一致性。分類精度大致呈現為草類最高,闊葉樹種組次之,針葉樹種組最低。分為樹種組后,分類精度較樹種識別有了較大的提高。
[1] 楊學軍,唐東芹,錢虹妹,等.上海城市綠化利用樹種資源的現狀與發(fā)展對策[J].植物資源與環(huán)境學報,2000,9(4):30-33.
[2] 王艷,代保清,卜軍.沈陽城市公園綠化樹種應用的現狀研究[J].沈陽師范大學學報:自然科學版,2006,24(4):486-489.
[3] 張劍峰.呼和浩特市建成區(qū)道路綠地樹種現狀分析及評價[D].呼和浩特:內蒙古農業(yè)大學,2010.
[4] 宮鵬,浦瑞良,郁彬.不同季相針葉樹種高光譜數據識別分析[J].遙感學報,1998,2(3):211-217.
[5] 王志輝,丁麗霞.基于葉片高光譜特性分析的樹種識別[J].光譜學與光譜分析,2010,30(7):1825-1829.
[6] 劉秀英,林輝,熊建利,等.森林樹種高光譜波段的選擇[J].遙感信息,2005(4):41-44,64.
[7] 韓凝,張秀英,王小明,等.基于面向對象的IKONOS影像香榧樹分布信息提取研究[J].浙江大學學報:農業(yè)與生命科學版,2009,35(6):670-676.
[8] 周堅華,周一凡,穆望舒.城鎮(zhèn)綠地樹種識別的數學描述符[J].遙感學報,2011,15(3):524-538.
[9] 劉懷鵬.基于WorldView-Ⅱ數據的呼和浩特市綠化樹種分類研究[D].呼和浩特:內蒙古農業(yè)大學,2013.
[10] 陳亮,劉希,張元.結合光譜角的最大似然法遙感影像分類[J].測繪工程,2007,16(3):40-42,47.
Maximum Likelihood in Identifying Huhhot Greening Tree Species/
Liu Huaipeng, An Huijun(Inner Mongolia Agricultural University, Huhhot 010019, P. R. China)//
劉懷鵬,男,1985年7月生,內蒙古農業(yè)大學林學院,博士研究生。E-mail:1476829808@qq.com。
安慧君,內蒙古農業(yè)大學林學院,教授。E-mail:dean6928@sohu.com。
2013年10月19日。
TP753
1) 內蒙古自然科學基金重點項目(20080404Zd10)。
責任編輯:王廣建。