萬曙靜,張承明,劉俊華
(1.中國測繪科學(xué)研究院政府地理信息中心,北京100083;2.山東農(nóng)業(yè)大學(xué)信息科學(xué)與工程學(xué)院,山東泰安271018;3.山東省農(nóng)科院,山東 濟(jì)南250100)
多光譜遙感圖像是土地利用應(yīng)用中主要的數(shù)據(jù)源,針對多光譜遙感圖像的根本特點研究適宜的分類算法,是獲取高精度土地利用信息主要手段。
20世紀(jì)80年代,主要是利用統(tǒng)計模式識別方法進(jìn)行遙感圖像的計算機(jī)分類[1]。20世紀(jì)90年代期間至今,涌現(xiàn)出了大量的遙感圖像分類方法,如人工智能分類法、遙感與GIS結(jié)合法、面向?qū)ο蟮姆诸惙?、?fù)合分類法等都取得較好的效果[2]。Dixon等將支持向量機(jī)法用于TM影像土地利用分類取得了最好的分類精度。Wardlow等在美國中央大平原采用決策樹分類方法進(jìn)行農(nóng)作物分類,取得了優(yōu)于80%的總體分類精度。陶超等[3]針對高分辨率遙感影像中“同譜異物”現(xiàn)象提出一種基于概率潛在語義模型的高分辨率遙感影像分類方法。李剛提出了基于高維云模型和改進(jìn)RBF神經(jīng)網(wǎng)絡(luò)的不確定性分類技術(shù)[4]。傳統(tǒng)的遙感圖像分類方法在自動化、智能化和分類精度方面不能令人滿意[5];基于神經(jīng)網(wǎng)絡(luò)的遙感分類技術(shù)盡管具有容錯能力好、自適應(yīng)性強(qiáng)等優(yōu)點,但在實際應(yīng)用中存在著結(jié)構(gòu)選取困難、局部收斂過快、學(xué)習(xí)過程難以控制等問題,導(dǎo)致其并不完全優(yōu)于傳統(tǒng)的分類技術(shù);基于決策樹的分類方法對邊界處理不太理想[6-7]。
本文根據(jù)多光譜遙感圖像的根本特點,綜合考慮土地利用分類的速度和精度,提出一種引入自適應(yīng)最小距離調(diào)整的分類方法,以期更好地滿足實際生產(chǎn)的需要。
現(xiàn)有遙感分類方法對如何提高聚類中心的生成研究較多,而在判定待分類像元的歸屬問題上,多采用先計算待分類像元與所有聚類中心的距離,再將其歸入距離最小的一類的方式,從而導(dǎo)致分類精度難以提高。
理想條件下,遙感圖像上代表同類地物的像元特征向量將分布在同一特征空間區(qū)域;而不同的地物由于特征向量不同,應(yīng)分布在不同的特征空間區(qū)域上,則對一個有b個波段待分類遙感圖像,圖像中任何一類地物在任一個波段中只有一個灰度值范圍,對于某個地物類c,可以獲取該類的像元在各個波段上的取值集合,如圖1所示。
圖1 理想條件下光譜范圍示意圖
對于類別c的某一波段i,以li表示其灰度值的下界,以hi表示其灰度值的上界,則在第i波段上,灰度值的中心mi值為:,以此為基礎(chǔ),可以定義為該類的中心特征向量,利用中心特征向量來更好地描述聚類中心的自適性變動情況。以ri表示波段i相應(yīng)的允許誤差半徑,根據(jù)上述分析,ri的值為可以將所有的波段最大允許誤差構(gòu)成的向量稱為有效半徑向量。對于一個欲分入c類的像元x,逐一比較每個波段上的灰度值與中心特征向量相應(yīng)分量的距離,如果距離都不超過相應(yīng)允許的半徑,則將其歸為c類。
“同物異譜”現(xiàn)象是由于同類地物由于種種原因,在某些波段或全部波段上的值偏差過大,從而導(dǎo)致該類的特征向量在特征空間上分布過于分散,難以像期望的歸于同一個集群中。為了更好地說明這個問題,現(xiàn)在以一個二波段圖像的分類為例進(jìn)行解釋,假設(shè)該圖像將被分為A、B兩個類,每個類的像元分布如圖2所示。
圖2 “同物異譜”導(dǎo)致分類錯誤的示意圖
在圖2中,由于類B的像元分布在兩個區(qū)域,生成的聚類中心與兩個區(qū)域的距離過大,從而導(dǎo)致識別的范圍(即大橢圓)過大。作為一種較為極端的情況,另一類別A的區(qū)域反而被包圍在了B的識別范圍,矩形包圍的一部本應(yīng)分為A類的像元,被錯誤地分為B類。
從以上分析可以看出,聚類中心及識別半徑過大導(dǎo)致兩個聚類中心的識別范圍相交,是分類精度降低的根本原因。為此,可以通過自適應(yīng)最小距離調(diào)整,對聚類中心進(jìn)行分裂,消除識別范圍相交,則可以有效地提高分類精度。
基于第2節(jié)中的方析,給出自適應(yīng)最小距離調(diào)整的方法為:在樣本學(xué)習(xí)結(jié)束后,對聚類中心進(jìn)行相交性判斷,如果根據(jù)兩個聚類中心的識別半徑生成的范圍相交的部分,則說明需要對聚類中心進(jìn)行分裂。具體的分裂步驟是:
1)對生成的聚類中心兩兩計算,判斷兩個聚類中心是否相交,如果相交,則按下一步處理。
2)對于兩個聚類中心中識別范圍過大的一個進(jìn)行分裂。從待分裂的類的樣本中任選一個樣本,隨機(jī)選取一個小于原來最大識別距離的值作為閾值,將樣本分為不同的子集,對每一個分別進(jìn)行學(xué)習(xí),產(chǎn)生各自的聚類中心,并與未分裂的類進(jìn)行相交性判斷,如果仍存在某個子集的聚類中心與其有相交的情況,則再選一個更小的閾值進(jìn)行,重新進(jìn)行分裂。
算法使用k-means算法對聚類中心進(jìn)行分裂,每次分解為兩個子集,并以二叉樹方式進(jìn)行樣本集合分裂。每一類生成一棵二叉樹,稱為該類的子集樹。二叉樹的一個節(jié)點對應(yīng)一個球體,記錄每個球體的球心半徑,以及對應(yīng)的樣本子集。球體的中心定義為該節(jié)點上樣本子集的中心,半徑是該節(jié)點上的樣本點到球心歐氏距離的最大值。由一個節(jié)點的子集細(xì)分得到的球體則表示為該節(jié)點的兩個子節(jié)點。
自適應(yīng)最小距離分類器對待分類點i的分類步驟如圖3所示。
圖3 自適應(yīng)最小距離分類算法流程圖
1)求出該點到各類對應(yīng)的子集樹的距離D。待分類點P到子集樹T的距離D(T,P)定義為:①如果P到T的根節(jié)點對應(yīng)的球心歐氏距離d大于該節(jié)點球體的半徑的兩倍,則忽略該節(jié)點細(xì)分得到的所有小球,并令D=d;②如果T的根節(jié)點已經(jīng)是葉節(jié)點,則令D=d;③ 若A、B均不滿足,則D遞歸定義為P到T的左右子樹T1,T2的距離D1,D2的最小者。
2)將距離D最小的一子集樹的類號賦予待分類點。
距離計算中使用了二叉樹查找,使得只有一部分節(jié)點參與距離D的求取,可以有效降低實際參加計算d的數(shù)并不多,保證了在樣本數(shù)量增大或者細(xì)分得到球體增多的情況下計算量不會增加很多。
本文選取山東省萊蕪市雪野流域作為研究區(qū)。選取水體、林地和裸露土壤3種差異較大的土地利用類別進(jìn)行分類比較。
試驗所用的數(shù)據(jù)源為分辨率為30m的ETM+影像,共8個波段,大小為1500像素×1200像素,獲取時間為2007年5月31日。
從圖4分類結(jié)果來看,采用最小距離法分類時,待分類像元數(shù)目明顯增多,待分類和林地混分的現(xiàn)象較為嚴(yán)重,水體受陰影影響存在錯分現(xiàn)象。K近鄰法可以很好地區(qū)分水體和祼露土地,但是對于林地卻不能很好地識別,有一部分林地被錯分成水體。最大似然法雖然對水體的分類效果較好,但林地、裸露土壤錯分為待分類現(xiàn)象嚴(yán)重。K近鄰法可以很好地區(qū)分水體和祼露土地,但是對于林地卻不能很好地識別,有一部分林地被錯分成水體。BP神經(jīng)網(wǎng)絡(luò)法對各類分類都有較好的效果,但是仍然有一部分植被類別未被區(qū)分出來。分類精度如表1所示。
圖4 雪野水庫分類結(jié)果
表1 常用分類方法分類精度
使用自適應(yīng)最小距離分類方法分類時,其試驗結(jié)果如圖5所示。
圖5 雪野水庫分類結(jié)果圖
不同訓(xùn)練樣本及類別模式的分類精度如表2所示。
表2 不同訓(xùn)練樣本及類別模式的分類精度
對比不同方法的分類結(jié)果,可以看出,利用本文方法進(jìn)行分類,結(jié)果中的待分類像元明顯減少,精度平均提高1.06%。
本文在建模分析分類問題的基礎(chǔ)上,提出了一種基于最小距離自適應(yīng)調(diào)整實現(xiàn)聚類中心分裂的方法。通過試驗與傳統(tǒng)分類方法作比較,該方法能夠有效提高分類精度,解決了分類方法中識別范圍相交導(dǎo)致分類精度難以提高的問題。結(jié)果證明了本方法的有效性和可靠性。
[1]羅來平.遙感圖像分類中模糊模式識別和決策樹方法的應(yīng)用研究[D].北京:首都師范大學(xué),2006.
[2]史澤鵬,馬友華,王玉佳.遙感影像土地利用/覆蓋分類方法研究進(jìn)展[J].中國農(nóng)學(xué)通報,2012,28(12):273-278.
[3]陶超,譚毅華,彭碧發(fā).一種基于概率潛在語義模型的高分辨率遙感影像分類方法[J].測繪學(xué)報,2011,40(2):155-161.
[4]李剛,萬幼川.基于高維云模型和RBF神經(jīng)網(wǎng)絡(luò)的遙感影像不確定性分類方法[J].測繪科學(xué),2012,37(1):115-118.
[5]錢茹茹.遙感影像分類方法比較研究[D].西安:長安大學(xué),2007.
[6]賈坤,李強(qiáng)子,田亦陳.遙感影像分類方法研究進(jìn)展[J].光譜學(xué)與光譜分析,2011,31(10):2618-2623.
[7]郭亞琴,王正群,樂曉容.基于自適應(yīng)距離度量的最小距離分類器集成[J].計算機(jī)應(yīng)用,2006,26(7):1703-1706.