,,
(大連科技學(xué)院 信息科學(xué)學(xué)院,遼寧 大連 116001)
隨著當(dāng)今科技的發(fā)展,遙感影像技術(shù)在科研及社會生產(chǎn)中得到廣泛的應(yīng)用,如農(nóng)業(yè)監(jiān)測、地理情況分析、天氣監(jiān)測等,遙感影像分類更是其核心技術(shù),多年來被研究人員重點研究與應(yīng)用。遙感影像分類大多對遙感影像的光譜圖提取出特征[2],對像元進(jìn)行分類,常用算法有決策樹算法[3]、K-Means[4]等。其中,決策樹算法屬于分類預(yù)測,通過多預(yù)先收集的樣本數(shù)據(jù)分析,構(gòu)造決策樹用于特征分類。因為遙感圖像的特征多樣性,光譜特征不能將遙感圖像特征很好的描述出來,所以需要對遙感圖像特征進(jìn)行運算處理,來有效的描述特征空間,再用來分類。常用的特征運算有K-T變換[5]、比值變換[6]以及差值變換[7]等等。隨著研究者的深入研究,后來產(chǎn)生了面向?qū)ο蟮姆诸惙椒?,即先分割,再分類。傳統(tǒng)的遙感影像特征提取只能在單個像素上進(jìn)行依靠光譜信息的特征提取,高分辨率的遙感影像由于波段較少,光譜分辨率不高,如果只提取光譜特征而忽略其他特征信息,則會降低分類精度,影像實驗結(jié)果[8]。所以,當(dāng)對較高分辨率的遙感影像進(jìn)行分類時,宜采用面向?qū)ο蟮倪b感影像分類。
遙感影像的光譜特征極其復(fù)雜,經(jīng)常會出現(xiàn)兩個不同的地物有同一光譜,或者兩個不同地物卻有著相同的光譜。僅依靠遙感圖像的光譜特征與紋理特征分類是不能保證分類效率與精度完全準(zhǔn)確的,所以本文需要進(jìn)行整合,共有三種整合方式:(1)分類前,對訓(xùn)練元組進(jìn)行人為地補充,使其更完善;(2)分類中,輔助數(shù)據(jù)參與分類;(3)分類后,改正分類結(jié)果中不正確的分類。在第二種整合中,輔助數(shù)據(jù)需要進(jìn)行量化處理,以便用于分類實驗中新增波段參與分類,本文可以將它當(dāng)做一個獨立的數(shù)據(jù)。
本文將分形和決策樹分類算法相結(jié)合,采用分形數(shù)學(xué)描述地物的紋理特征,將多光譜影像和紋理圖像結(jié)合,以改進(jìn)決策樹分類器開展遙感影像分類研究。
目前,應(yīng)用分形理論進(jìn)行遙感影像分類的研究也有很多,主要集中在分形維數(shù)計算方法以及基于分形維數(shù)的遙感影像分割等方面[9]。分形理論在紋理分析的應(yīng)用中,通常采用分形維數(shù)來描述紋理[10]。分形維數(shù)用來表示自然界中地物的不規(guī)則程度,其并不一定是整數(shù),分形維數(shù)也可以用分?jǐn)?shù)來表示,與歐氏幾何中的整數(shù)維有明顯的差別。分形維數(shù)最大的特點是其與人的視覺感受相互一致,即影像表面越粗糙,分形維數(shù)越大。而且分形維數(shù)在多尺度,即多種空間分辨率上具有不變性。因此使用分形維數(shù)能夠很好地描述遙感影像的紋理特征。
分形維數(shù)的計算方法有差分盒維數(shù)法[11]、基于灰度插值法[12]、基于分型布朗運動自相似模型[13]的方法、以及毯覆蓋模型[14]等方法。
本文采用Peleg提出的計算灰度圖像分形維數(shù)的毯覆蓋模型來計算遙感影像的分形維數(shù)。毯覆蓋法將圖像視為有一定高度的山體,高度為圖像的灰度值。在距離山體表面ε的上下方鋪蓋厚度為2ε的毯子。設(shè)遙感影像的灰度值為g(i,j),毯子的上表面用aε表示,下表面用bε表示,公式(1)表示初始條件,上下表面的生長原則分別為公式(2)、(3),其中d表示(m,n)和(i,j)兩點之間的距離。
g(i,j)=a0(i,j)=b0(i,j)
(1)
aε(i,j)={max{aε(i,j)+1,maxaε(m,n),
d(i,j,m,n)≤1,ε=1,2,...}
(2)
bε(i,j)={min{bε-1(i,j)-1,minbε-1(m,n),
d(i,j,m,n)≤1,ε=1,2,...}
(3)
因此毯子的容積為:
Vε=∑i,j(aε(i,j)-bε(m,n))
(4)
表面積為:
(5)
分形表面積符合關(guān)系式A(ε)=Fε2-D,所以
logA(ε)=c1logε+c0
(6)
其中,c1=2-D為擬合的直線的斜率,通過改變尺度ε的大小,可以求出不同的c1,從而可以求出分形維數(shù)D。
特征提取是基于像元遙感影像分類中的最重要步驟之一,遙感影像的光譜特征與空間特征有很多,但是不是所有特征都可用于遙感影像分類。所以要從眾多的特征中選擇出可用于遙感影像分類的特征。之后還要進(jìn)行提取,才能進(jìn)行分類。常用的提取方法如下:
纓帽變換也成為K-T變換,即將一幅遙感影像解譯出幾個數(shù)據(jù),濕度指數(shù)、綠度指數(shù)和亮度指數(shù)等[15],如公式(7)所示:
Y=RTx+r
(7)
其中,R為纓帽變換系數(shù),r為常數(shù)偏移量。X和Y分別為變換前后多光譜空間的像元矢量。對遙感影像光譜圖的1~5波段和7波段進(jìn)行纓帽變換,R如公式(8)。
(8)
對遙感影像進(jìn)行植被生長情況分析會用到植被指數(shù),利用遙感影像光譜圖近紅外波段與紅外波段反射值之差與之和的比值可以反映植被特征[16]。依據(jù)植被指數(shù)就可以對一幅遙感影像中的植被進(jìn)行分類。常用的植被指數(shù)有歸一化植被指數(shù)(NDVI)??捎晒?9)得出:
(9)
其中,Pnir和Pred分別為遙感多波段影像中的近紅外波段和紅波段的反射值;如果得到的數(shù)值處于0.3-0.7之間都代表植被特征,可以用于分類。
不是所有的影像都在很小區(qū)域能呈現(xiàn)規(guī)則性,但是大范圍的整體卻能體現(xiàn)出規(guī)則這就是紋理特性。在遙感影像分類中,將紋理特征作為輔助特征進(jìn)行分類,可提高分類的正確率。本文知道紋理特征需要對像元集進(jìn)行處理,需要特定的測試算法可以采用統(tǒng)計量算法[17],需要用到的統(tǒng)計量有均值(10)、方差(11)和熵(12),其計算需要用到總像元數(shù)目,記為w,第i級灰度概率fi,以及第k波段的量化等級,記為quantk。
(10)
(11)
(12)
由于遙感影像的特征提取過于繁瑣,不在本文的研究范圍內(nèi),所以在前文介紹了原理,實踐操作需借助第三方軟件ENVI 5.1來實現(xiàn)。本文采用的遙感影像為Landsat7 ETM+遙感影像,其數(shù)據(jù)波段的第六波段是熱紅外,不能有效反應(yīng)不同地物的特征,對于分類無實際意義,所以不采用。第一至第五以及第七波段中有RGB可見光波段,包括一個B4近紅外,區(qū)分地物類型。
下面應(yīng)用ENVI5.1軟件,介紹變換提取Landsat7 ETM+遙感影像特征數(shù)據(jù)過程。
(1)打開一個Landsat7 ETM+數(shù)據(jù)。
(2)Toolbox中,選擇/Radiometric Correction /Radiometric Calibration,選LC8多光譜數(shù)據(jù)。
(3)校準(zhǔn)類型:點擊Reflectnace,指定輸出文件的路徑和文件名稱執(zhí)行即可
(4)在主界面中,選擇File->Save as,選擇LC8大氣表觀反射率定標(biāo)結(jié)果,再點擊Spectral Subset按鈕,選擇后面6個波段。
(5)在Toolbox中,選擇Transform/Tasseled Cap。在文件對話框中選擇上一步得到的數(shù)據(jù)文件。
(6)在Tasseled Cap Transform Parameters面板中,傳感器類型選擇Landsat7 ETM。
(7)選擇輸出路徑和文件名
實驗選擇預(yù)處理后的2015年夏季北京市l(wèi)andsat 7多光譜遙感影像,裁剪得到北京市五環(huán)內(nèi)區(qū)域。為了進(jìn)一步去除影像中的噪聲和干擾,對影像進(jìn)行主成分變換。
首先進(jìn)行主成分正變換,發(fā)現(xiàn)前三個主成分已經(jīng)占據(jù)了原始影像中的絕大多數(shù)信息,而且自第4主成分起,圖像中出現(xiàn)了明顯的噪聲,所以選取前三個主成分進(jìn)行主成分逆變換,得到北京市五環(huán)內(nèi)變換后遙感影像,如圖1所示。
圖1 主成分變換影像
通過資料搜集以及觀察變換后圖像可以發(fā)現(xiàn),研究區(qū)域內(nèi)的主要地物類型有建筑物、植被、道路以及水體,幾乎沒有裸地,故而分類時將區(qū)域內(nèi)的地物類型區(qū)分為建筑物、植被、道路、水體四類。為了最大程度利用影像的信息,選取了信息量最大的第一主成分灰度圖像來計算分形維數(shù),如圖2所示。
圖2 第一主成分
在本實驗過程中,試驗了3×3,5×5,7×7的窗口以及不同的毯子覆蓋的尺度范圍,提取紋理特征圖像。分析后發(fā)現(xiàn)使用5×5大小的窗口,且毯子覆蓋的尺度的范圍為50-100時提取的紋理最為豐富且最后參加分類得到的效果較好,如表1所示。
表1 分類精度
從表1可以發(fā)現(xiàn),加入紋理特征后的分類總體精度和Kappa系數(shù)相比于純光譜數(shù)據(jù)都有提高,總體精度提高了1.051 3%,Kappa系數(shù)提高了0.011。這說明了紋理特征與光譜特征結(jié)合可以改善分類的效果,基于分形理論的紋理特征有助于分類精度的提高。
圖3 毯覆蓋算法提取的紋理特征圖像
觀察圖3紋理特征圖像可以發(fā)現(xiàn),建筑物密集分布的區(qū)域圖像亮度較大,代表該區(qū)域的紋理復(fù)雜;而大面積的植被以及道路和水體等表面較光滑的區(qū)域圖像亮度偏暗,代表這些區(qū)域的紋理復(fù)雜度小。這也表明了該圖像能夠反映出地物的紋理復(fù)雜程度。
根據(jù)北京市五環(huán)內(nèi)的地物特點,將土地類型分為建筑物、道路、植被、水體四種,并分別選取一定數(shù)量的樣本。將計算得到的紋理特征與光譜特征結(jié)合,使用決策樹分類器進(jìn)行分類;使用相同的樣本,使用決策樹分類器只對光譜數(shù)據(jù)進(jìn)行分類,對分類結(jié)果分析比較。分類器的各項參數(shù)采用默認(rèn)值。分類結(jié)果如圖4,圖5。
圖4 光譜特征和紋理特征結(jié)合的分類結(jié)果
圖5 僅利用光譜特征的分類結(jié)果
表2和表3可以看出,加入紋理特征數(shù)據(jù)后,紋理特征明顯的道路和植被的分類精度都有所提高。其中道路數(shù)據(jù)的用戶精度提高幅度最大。
表2 基于光譜特征分類的用戶精度
表3 基于光譜特征和紋理特征結(jié)合分類的用戶精度
圖6 純光譜特征分類結(jié)果
圖7 光譜特征和紋理特征結(jié)合的分類結(jié)果
圖6和圖7可以發(fā)現(xiàn),加入紋理特征后,道路與建筑物的區(qū)分度得到較大的提高,部分錯分為道路的建筑物重新劃分為建筑物。這主要是因為landsat7遙感影像中,道路和建筑物的光譜特征非常接近,只利用光譜特征進(jìn)行分類時,這兩種地物類型容易混淆;但是這兩種地物的紋理特征有較大的差別,建筑物的紋理是破碎的塊狀,而道路的紋理大多數(shù)為長條狀,兩者的紋理復(fù)雜度有較大的區(qū)別,所以根據(jù)紋理特征可以較好的將這兩種地物區(qū)分開來。
利用改進(jìn)決策樹分類,關(guān)于精度評價方面,本文隨機采樣對其進(jìn)行精度評價,對于錯誤的分類借助GPS,實地考察進(jìn)行糾正,利用了總體分類精度、Kappa系數(shù)和混淆矩陣。為了驗證算法改進(jìn)是否有效,對實驗結(jié)果進(jìn)行了橫向?qū)Ρ?,如?所示。
表4 幾種算法比較
由表4可以觀察出,與傳統(tǒng)Boost Tree分類算法相比,本文改進(jìn)的組合決策樹算法更優(yōu)越;與C5.0相比,本文設(shè)計算法與其相比,分類精度也幾乎一樣。
傳統(tǒng)的分類方法局限于遙感影像的光譜特征,容易由于同物異譜、異物同譜等原因造成分類結(jié)果精度不高。本文研究表明,利用分形理論可以有效地描述遙感影像的紋理特征。相比于傳統(tǒng)的只利用光譜特征改進(jìn)決策樹分類的方法,通過第三方軟件ENVI對遙感影像進(jìn)行了特征提取,融合光譜特征和分形紋理特征有助于決策樹分類算法精度的提高,特別是對于紋理特征明顯的地物的分類效果更佳。本實驗的不足之處首先在于毯覆蓋算法只計算出了特定尺度范圍下的分形維數(shù),其次是決策樹分類算法計算所需時間較長。而當(dāng)紋理結(jié)構(gòu)不同時,應(yīng)當(dāng)選擇不同的尺度,才能更好地描述分形特征。在后續(xù)的研究中,應(yīng)當(dāng)對算法進(jìn)行改進(jìn),采用多尺度分維的方法估算分形維數(shù),從而更好地反映分形特征。