張濤
(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢 430079)
一種利用K均值和SOM進行遙感圖像分類的方法
張濤
(武漢大學(xué)遙感信息工程學(xué)院,湖北武漢 430079)
探討了一種將K均值算法和SOM神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的方法,并將其應(yīng)用于多光譜遙感圖像分類,通過與K均值算法、ISODATA算法和SOM算法的對比實驗,驗證了該方法的有效性。
遙感圖像分類;神經(jīng)網(wǎng)絡(luò);自組織映射;K均值算法
遙感技術(shù)已經(jīng)廣泛應(yīng)用于很多領(lǐng)域,遙感影像分類是遙感技術(shù)應(yīng)用的關(guān)鍵問題。傳統(tǒng)的遙感圖像非監(jiān)督分類方法過于依賴圖像數(shù)據(jù)的分布,人工神經(jīng)網(wǎng)絡(luò)不基于數(shù)據(jù)分布的特性,作為一種智能信息處理的重要方法,為實現(xiàn)圖像自動分類創(chuàng)造了條件[1]。具有非監(jiān)督學(xué)習(xí)能力的自組織映射網(wǎng)絡(luò),結(jié)構(gòu)簡單、易于實現(xiàn),應(yīng)用于數(shù)據(jù)分類時能夠取得較好的效果。在SOM的眾多分類改進算法中,通常是對其自身網(wǎng)絡(luò)參數(shù)如初始化權(quán)值進行改進[1,2],或?qū)?SOM 與常規(guī)的聚類算法相結(jié)合[3,4]。其中,將SOM和K均值進行結(jié)合可以有兩種策略:一種是用SOM對K均值算法進行改進,即用SOM神經(jīng)網(wǎng)絡(luò)改進K均值聚類算法的初始化中心和確定聚類中心數(shù)目,并已應(yīng)用于圖像分割[5]、文檔聚類[6]、客戶分類[7]和聲波數(shù)據(jù)分割[8]等領(lǐng)域;另一種是用K均值改進SOM算法,即先進行K均值聚類,然后再進行SOM聚類。該方法已被應(yīng)用于遙感圖像分類。Su和Chang用K均值算法改進SOM網(wǎng)絡(luò)的初始權(quán)向量,即用K均值算法找到的N×N個聚類中心作為SOM網(wǎng)絡(luò)的初始化權(quán)值,但是遙感圖像的分類數(shù)目不一定能滿足N×N的條件[9]。Zhou等將小波分解出的不同尺度下的遙感圖像進行分步處理,即先用K均值算法對粗尺度的遙感圖像進行分類,再在此基礎(chǔ)上用SOM算法進行細尺度的分類,抗噪性強,提高了分類精度和速度;但該方法也存在分類類別數(shù)需要預(yù)先確定問題[10]。
本文在前人的研究基礎(chǔ)上,探討了一種將K均值和SOM相結(jié)合進行多光譜遙感圖像分類的方法。首先用K均值算法對遙感影像進行粗聚類,以減少SOM聚類模式的輸入量,然后將K均值的聚類結(jié)果作為SOM的網(wǎng)絡(luò)輸入值進行自組織學(xué)習(xí)訓(xùn)練,每一個像素點對應(yīng)的獲勝神經(jīng)元作為它的判別類別,并在輸出層設(shè)置一個迭代閾值,將聚類數(shù)目小于該閾值的神經(jīng)元所分的類別劃分到最近的神經(jīng)元中,實現(xiàn)類別合并,最終實現(xiàn)遙感影像分類。將本文的分類方法與K均值算法和ISODATA算法以及SOM算法進行遙感圖像分類的對比試驗,本文的分類方法取得了較好的分類效果,實驗結(jié)果驗證了該方法的有效性。
1.1 K均值算法
K均值算法屬于一種典型的劃分聚類方法[11],其基本思想是通過迭代把數(shù)據(jù)對象劃分到不同的簇中,使簇內(nèi)對象之間的相似度很大,而簇間對象的相似度很小。
K均值算法的具體過程如下:1)選取k個對象作為初始的聚類中心;2)根據(jù)聚類中心值,將每個對象(重新)賦給最相似的簇;3)重新計算每個簇中對象的平均值,用此平均值作為新的聚類中心;4)重復(fù)執(zhí)行步驟2和步驟3,直到聚類中心不再發(fā)生變化為止。
K均值算法聚類結(jié)果受初始聚類中心選擇的影響較大,如果初始聚類中心選取不當,聚類結(jié)果可能會陷入局部最優(yōu)解,從而得不到較好的聚類效果。
1.2 SOM算法
自組織映射網(wǎng)絡(luò)是一種模擬哺乳動物大腦皮質(zhì)神經(jīng)元的側(cè)抑制、自組織等特性的神經(jīng)網(wǎng)絡(luò)模型。它是一種競爭式學(xué)習(xí)網(wǎng)絡(luò),自適應(yīng)學(xué)習(xí)能力和魯棒性強,能無監(jiān)督地進行自組織學(xué)習(xí),且能夠把多維數(shù)據(jù)映射到低維空間,同時保持多維數(shù)據(jù)的拓撲結(jié)構(gòu)和信息。
SOM 的拓撲結(jié)構(gòu)一般為兩層:輸入層和競爭層,如圖1所示。其神經(jīng)元的排列有多種形式:一維線陣、二維平面陣和三維柵格陣。最典型的結(jié)構(gòu)是二維形式,它更具有大腦皮層的形象[12]。
圖1 二維陣列SOM網(wǎng)絡(luò)模型 [13]
傳統(tǒng)的聚類方法,如K均值、ISODATA等算法在處理低維、小數(shù)據(jù)量時具有較高的效率,但對圖像的數(shù)據(jù)分布依賴性強,抗噪能力弱,常常難以達到理想的分類效果;SOM算法擁有神經(jīng)網(wǎng)絡(luò)不基于數(shù)據(jù)分布的一般特性,分類過程中能夠?qū)崿F(xiàn)數(shù)據(jù)的降維。本文對將K均值與SOM相結(jié)合的方法進行探討,首先采用K均值算法進行粗聚類,K均值算法的聚類個數(shù)超過最終聚類個數(shù),將容易錯分的數(shù)據(jù)先分到數(shù)目較小的類別中;然后將聚類中心值替換原有像素點的值,作為SOM網(wǎng)絡(luò)的輸入模式,進行二次聚類。這樣可以保持K均值算法初始聚類中心的隨機選取和SOM初始權(quán)值的隨機選取的特性,避免K均值算法易陷入局部最小的缺陷,同時充分利用SOM算法抗噪性強的特點進行處理,減少網(wǎng)絡(luò)訓(xùn)練次數(shù),達到提高SOM網(wǎng)絡(luò)分類效率的目的。算法步驟如下:1)進行K均值聚類,得到超過目標聚類數(shù)目的聚類類別數(shù);2)權(quán)值初始化。記wij為第j個輸入端與第i個神經(jīng)元的權(quán)值,j=1,2,...,n,n為輸入層神經(jīng)元數(shù)目,i=1,2,...,m,m為輸出層神經(jīng)元數(shù)目。權(quán)值初始化是指用較小的隨機數(shù)初始化輸入層到競爭層的連接權(quán)值wij,記為wij(0)。建立初始優(yōu)勝鄰域Nc(0)和學(xué)習(xí)率a初值;3)輸入步驟1)中得到的聚類結(jié)果模式作為一個輸入模式。從訓(xùn)練集中取一個輸入模式x,令t=0。4)計算競爭層的所有權(quán)值向量和輸入向量的歐式距離:
5)尋找距離最小的神經(jīng)元c,即為勝出神經(jīng)元:
6)定義優(yōu)勝鄰域Nc(t)。以c為中心確定t時刻的權(quán)值調(diào)整域,初始時t∈0。一般初始域Nc(0)較大(為總結(jié)點的50%~80%),訓(xùn)練過程中Nc(t)隨訓(xùn)練時間收縮。7)調(diào)整優(yōu)勝鄰域Nc(t)內(nèi)的所有節(jié)點的權(quán)值:
式中,a(t)是學(xué)習(xí)因子,一般隨時間而遞減,范圍0<a(t)<1;Nc(t)是c的鄰域,其中半徑隨t而減小[14]。
7)令t=t+1,轉(zhuǎn)步驟4);8)當t=T0(T0為時間閾值),或a<amin(amin為學(xué)習(xí)率閾值)時,停止對當前樣本的學(xué)習(xí),轉(zhuǎn)步驟3);9)重復(fù)步驟3)~9),直至所有樣本參與聚類。
聚類閾值是實現(xiàn)確定最終聚類數(shù)目的關(guān)鍵步驟。本文的方法通過SOM輸出層設(shè)置的聚類閾值,實現(xiàn)最終聚類數(shù)目的確定。SOM網(wǎng)絡(luò)在學(xué)習(xí)訓(xùn)練結(jié)束后,其各個輸出層神經(jīng)元擁有的像素點數(shù)目可能存在極小的情況。設(shè)置一個聚類閾值,將聚類數(shù)目小于該閾值數(shù)目的神經(jīng)元消去,將屬于該神經(jīng)元的點分到最近的神經(jīng)元上,即實現(xiàn)類別自動合并。聚類閾值的數(shù)值可以根據(jù)具體的圖像大小和目標聚類類別數(shù)目進行確定。
本文選取宜昌地區(qū)TM遙感影像進行分類實驗,影像分辨率為 30 m,如圖2(a)所示。依據(jù)目視判讀,影像分為水體、植被、居民區(qū)、裸露地四類。對影像采用本文的方法進行聚類試驗,聚類結(jié)果如圖 2(b)所示。采用傳統(tǒng)K均值方法和ISODATA方法對影像進行分類,分類結(jié)果如圖2(c)、(d)所示。K均值分類結(jié)果中的居民地和植被、水體混淆嚴重;ISODATA分類結(jié)果中的居民地和植被、水體混淆現(xiàn)象稍微減弱;本文的方法將居民地和植被、水體準確地提取出來,減少了它們之間的混淆程度。
圖2 聚類結(jié)果
對上述幾種分類方法進行精度評定,分類精度及Kappa系數(shù)比較結(jié)果如表1所示。
表1 分類精度
對圖2(a)使用SOM算法進行分類,迭代2 302次后收斂,本文的方法中先使用K均值69次迭代后收斂,然后使用SOM 102次迭代后收斂。相對于單獨使用K均值方法和SOM方法,本文探討的將二者相結(jié)合的聚類方法具有較高的分類精度和較快的速度,對比實驗驗證了本文方法的有效性。
本文探討了一種將K均值算法和SOM算法結(jié)合進行遙感影像分類的方法。該方法既發(fā)揮了K均值算法在對相對較小數(shù)據(jù)量進行聚類時效率較高的特點,又保持了SOM算法自組織的特點,并且將二者結(jié)合的方法在分類性能上也得到了提高。通過實驗表明,該方法具有比傳統(tǒng)K均值算法和ISODATA算法更好的分類精度,比傳統(tǒng)的SOM算法更高的聚類效率和更好的聚類性能。進一步的研究方向包括:對SOM聚類方法進行改進,使其能夠處理高分辨率的多維數(shù)據(jù),從而研究出適合于高效處理大數(shù)據(jù)量的多維遙感圖像的分類方法。
[1] 諶德榮,陶鵬,宮久路,等.一種基于SOFM神經(jīng)網(wǎng)絡(luò)的高光譜圖像快速分類方法[J].兵工學(xué)報,2009,30(2):165-169
[2] 吳柯,方強,張俊玲,等.基于改進Kohonen神經(jīng)網(wǎng)絡(luò)的遙感影像分類[J].測繪信息與工程,2007,32(2):47-49
[3] 張釗,王鎖柱,張雨.一種基于SOM和PAM的聚類算法[J].計算機應(yīng)用,2007,27(6):1400-1402
[4] GoncalvesML,Netto MLA,Costa JAF,et al.An Unsupervised Method of Classifying Remotely Sensed Images Using Kohonen Self-organizing Maps and Agglomerative Hierarchical Clustering Methods[J].International Journal of Remote Sensing,2008,29:3171-3207
[5] 許海洋,王萬森.基于SOM神經(jīng)網(wǎng)和K-均值算法的圖像分割[J].計算機工程與應(yīng)用,2005,41(21):38-40,57
[6] 楊占華,楊燕.一種基于SOM和k-means的文檔聚類算法[J].計算機應(yīng)用研究,2006,23(5):73-79
[7] Kuo RJ,An YL,Wang HS,et al.Integration of Self-organizing Feature Maps Neural Network and Genetic K-means A lgorithm for Market Segmentation[J].Expert Systems with Applications, 2006,30:313-324
[8] Godin N,Huguet S,Gaertner R.Integration of the Kohonen's Self-organising Map and K-means A lgorithm for the Segmentation of the AEData Collected during Tensile Tests on Cross-ply Composites[J].NDT&International,2005,38:299-309
[9] Su MC,Chang HT.FastSelf-Organizing Feature Map A lgorithm [J].IEEETransactionson NeuralNet works,2000,11(3):721-733
[10]Zhou ZS,WeiSY,Zhang XW,etal.Remote Sensing Image Segmentation based on Self-organizing Mapat Multiple-scale[J].Geoinformatics 2007:Remotely Sensed Data and Information, 2007,6752:E7520-E7520
[11]Kanungo T,Mount DM,Netanyahu NS.An Efficient K-means Clustering Algorithm:Analysis and Implementaion[J].IEEE Transactionson Pattern Analysis and Machine Intelligence,2002, 24(7):881-892
[12]秦昆.智能空間信息處理[M].武漢:武漢大學(xué)出版社,2009
[13]陳泯融,鄧飛其.一種基于自組織特征映射網(wǎng)絡(luò)的聚類方法[J].系統(tǒng)工程與電子技術(shù),2004,26(12):1864-1866
[14]史忠植.神經(jīng)網(wǎng)絡(luò)[M].北京:高等教育業(yè)出版社,2009
Rem ote Sensing Image Classification Utilizing K-m eansand SOM
by Zhang Tao
Amethod ofm ultispectra l remote sensing im age classification was discussed in the paper,which utilized K-means and SOM neuralnetwork.The com parison experim ents w ith K-means,ISODATA and SOM verify the validity of themethod.
remote sensing image classification,neuralnetwork,selforganizingmap,K-means (Page:109)
P237
B
1672-4623(2011)01-0109-03
2010-07-09
項目來源:武漢大學(xué)2009年大學(xué)生科研基金資助項目(S2009291)。
張濤,本科,主要研究遙感影像分類。