李勇發(fā),左小清,楊 芳,林 思,張建柱
(昆明理工大學(xué) 國(guó)土資源工程學(xué)院,云南 昆明 650093)
基于FCM聚類及其改進(jìn)的遙感圖像分割算法
李勇發(fā),左小清,楊 芳,林 思,張建柱
(昆明理工大學(xué) 國(guó)土資源工程學(xué)院,云南 昆明 650093)
在遙感圖像分割中,某些像素分類具有不確定性和隨機(jī)性,模糊C- 均值(FCM)聚類算法對(duì)處理這種不確定性和隨機(jī)性具有很大的優(yōu)勢(shì),但傳統(tǒng)的FCM算法具有很大的缺點(diǎn)。對(duì)此,該研究提出一種改進(jìn)的FCM遙感圖像分割算法。首先,該算法在選取聚類中心和聚類數(shù)時(shí)使用直方圖進(jìn)行選取,克服了傳統(tǒng)FCM算法選取時(shí)的隨機(jī)性和人為性;然后,使用叉熵距離測(cè)度代替歐氏距離測(cè)度,克服了傳統(tǒng)FCM算法依賴于球狀分布的缺點(diǎn);最后,利用傳統(tǒng)FCM算法和改進(jìn)后的FCM算法對(duì)某水電站大壩遙感圖像進(jìn)行分割實(shí)驗(yàn),比較2種方法的分割效果,結(jié)果顯示,改進(jìn)的FCM算法大大提高了遙感圖像聚類的效率和分類的精度。
圖像分割; 聚類分析; 模糊C- 均值
遙感圖像作為制作和更新GIS數(shù)據(jù)庫(kù)的重要數(shù)據(jù)源,已被廣泛應(yīng)用于土地利用、環(huán)境監(jiān)測(cè)、資源勘探、災(zāi)害評(píng)估、城市規(guī)劃等領(lǐng)域中。隨著遙感與信息技術(shù)的不斷發(fā)展,各種海量的遙感數(shù)據(jù)都可以通過對(duì)地觀測(cè)技術(shù)進(jìn)行獲取,然而數(shù)據(jù)轉(zhuǎn)化成信息的過程當(dāng)中仍存在很多瓶頸,其中遙感圖像分割就是一項(xiàng)非常關(guān)鍵的技術(shù),同時(shí)也是圖像處理領(lǐng)域的難點(diǎn)和重點(diǎn)。遙感圖像分割是指對(duì)遙感圖像進(jìn)行處理、分析,從中提取目標(biāo)的技術(shù)和過程。當(dāng)前雖然已經(jīng)有了大量的圖像分割算法,但由于遙感圖像通常具有灰度級(jí)多、信息量較大、邊界不清晰、目標(biāo)類型較多等特點(diǎn),導(dǎo)致這些算法在實(shí)際應(yīng)用中還存在很多問題,如適用性差、分割效率低、分割精度不高等[1],加之遙感圖像的分割本身具有不確定性,不同的應(yīng)用目的和用戶對(duì)圖像感興趣的部分不同,期望從圖像中獲得的信息層次也往往不同,致使難以建立完全準(zhǔn)確的分割方法對(duì)遙感圖像進(jìn)行分割??傮w來看,在進(jìn)行遙感圖像分割處理時(shí),通常采用模糊理論的方法。但傳統(tǒng)的模糊C- 均值(FCM)聚類算法存在以下不足:(1)傳統(tǒng)FCM算法的運(yùn)行效果與初始聚類中心和聚類數(shù)密切相關(guān),而初始聚類中心和聚類數(shù)具有隨機(jī)性,導(dǎo)致每次運(yùn)行效果差異較大;(2)由于FCM算法很大程度上依賴于球狀樣本數(shù)據(jù),對(duì)于非球狀樣本數(shù)據(jù),其聚類效果并不理想[2]。為此,本研究提出一種改進(jìn)的FCM聚類算法?,F(xiàn)報(bào)道如下。
1.1 FCM聚類算法
FCM聚類算法是一種無監(jiān)督的分類方法,根據(jù)最小二乘原理,計(jì)算目標(biāo)函數(shù)的均方差,得到每個(gè)數(shù)據(jù)點(diǎn)對(duì)類中心的隸屬度和目標(biāo)函數(shù)的最小值,是一種基于目標(biāo)函數(shù)的非線性迭代的最優(yōu)化方法[3]。
1.2 FCM聚類算法的原理
1.2.1 聚類目標(biāo)函數(shù)
聚類算法的目標(biāo)函數(shù)由開始的類內(nèi)誤差平方和的形式演化而來,之后經(jīng)推廣,演變成了更具普遍意義的形式。類內(nèi)誤差平方和形式的目標(biāo)函數(shù)實(shí)際上是Ruspini提出的硬聚類分析的目標(biāo)函數(shù)[2],它的形式為:
式中:J表示目標(biāo)函數(shù);U=[uij]c×n表示硬劃分矩陣,取值范圍為{0,1};V=(v1,v2,…,vc)是一個(gè)聚類中心向量,對(duì)所有的i=1,2,…c,有v1(vi1,vi2,…,vis)∈Rs,它代表第i類聚類中心;dij表示第j個(gè)樣本點(diǎn)與第i類聚類中心之間的失真度,經(jīng)常用距離函數(shù)來度量。
利用硬劃分矩陣的取值不是0就是1的特點(diǎn),可以將uij作為權(quán)值對(duì)距離函數(shù)進(jìn)行加權(quán),此時(shí)目標(biāo)函數(shù)可以表示為:
把硬聚類算法的目標(biāo)函數(shù)運(yùn)用到模糊情形,將隸屬度的平方對(duì)聚類中心與樣本點(diǎn)之間的距離進(jìn)行加權(quán),就把類內(nèi)誤差平方和目標(biāo)函數(shù)變成類內(nèi)加權(quán)誤差平方和目標(biāo)函數(shù)[3- 4],如下所示:
式中,U=[uij]c×n表示模糊劃分矩陣,取值范圍為[0,1],其他變量不改變含義,將其推廣為更廣泛的形式,并對(duì)FCM目標(biāo)函數(shù)的表示作更廣泛的描述:
式中α∈[1,+∞)為模糊因子,主要用它來控制分享程度,α越大,表明隸屬關(guān)系越模糊,反之表明隸屬關(guān)系越清楚。
當(dāng)α→+∞時(shí),J→0且U中全部元素都靠近1/c,就會(huì)失去模糊聚類的意義;當(dāng)α=1時(shí),就成為了硬聚類。因此主要由α來控制隸屬度的值,使模糊分類的特點(diǎn)更加明確。
1.2.2 拉格朗日(Lagrange)乘數(shù)法[5]
FCM算法中數(shù)據(jù)集的模糊劃分是采用迭代的方法來實(shí)現(xiàn),用數(shù)學(xué)的方式表示為:
用歐氏距離表示失真度dij,則目標(biāo)函數(shù)的表達(dá)式為:
對(duì)目標(biāo)函數(shù)J求導(dǎo),可獲得聚類中心的更新式,即:
2.1 改進(jìn)FCM聚類算法的原理
2.1.1 初始聚類中心與聚類數(shù)的選取
在傳統(tǒng)FCM算法中,初始聚類中心與聚類數(shù)的選取對(duì)于聚類效果具有很大的影響[4]。為解決聚類中心和聚類數(shù)在選取過程中的隨機(jī)性,利用直方圖交互獲取初始聚類中心與聚類數(shù)。具體做法如下:將彩色的遙感圖像從RGB顏色空間變?yōu)樘卣黝伾臻g,并計(jì)算出它的直方圖,利用直方圖波峰的個(gè)數(shù)來確定圖像的聚類數(shù),然后再利用在原先基礎(chǔ)上減1或加1的方法進(jìn)一步修正聚類數(shù)。聚類中心為波峰處的像素值。
2.1.2 距離測(cè)度的選擇
傳統(tǒng)FCM算法假定樣本呈球狀或者橢球狀排列,并據(jù)此選用了歐氏距離測(cè)度。但實(shí)際情況中。樣本數(shù)據(jù)并不完全呈球狀排列,因此,傳統(tǒng)FCM算法不能很好地用于非球狀排列數(shù)據(jù)的聚類。為提高其魯棒性,本研究選用交叉熵距離測(cè)度。
交叉熵距離是用來衡量2種概率分布之間信息量差異的量,又稱為特征散度距離,設(shè)樣本數(shù)據(jù)集X={x1,x2,…,xn},Y={y1,y2,…yn},則交叉熵距離可表示為:
D(X:Y)=[d(x1,y1),d(x2,y2),…d(xn,yn)]T;
若樣本集中數(shù)據(jù)取值為正值時(shí),則特征散度的分量滿足同一性和非負(fù)性。
鑒于人的視覺感受相同,所以考慮在Lab均勻顏色空間中分割圖像。L分量表示圖像的亮度,a分量和b分量分別對(duì)稱。人對(duì)于通過均勻顏色空間內(nèi)任意一點(diǎn)距離相同的地方的視覺感受是一樣的,因此本文在Lab均勻顏色空間中對(duì)圖像進(jìn)行分割。L分量表示圖像的亮度,a分量和b分量分別對(duì)稱,ΔC代表圖像色差,圖像中第i、j個(gè)像素在Lab空間中的色差可以表示為:
ΔC的值越小,表明兩點(diǎn)間的色差越小。因此,可用下列目標(biāo)函數(shù)描述像素間相似程度的非相似性:
式中d是利用叉熵測(cè)度定義的距離。
2.2 改進(jìn)FCM聚類算法的步驟
根據(jù)以上原理,改進(jìn)的FCM算法分割步驟如下:首先,將彩色圖像從RGB顏色空間轉(zhuǎn)換到Lab空間;其次,提取圖像像素的ab分量(色度空間);然后,計(jì)算ab分量的直方圖,并運(yùn)用直方圖交互獲取圖像的聚類中心與聚類數(shù);最后,利用目標(biāo)函數(shù)進(jìn)行FCM聚類,記錄聚類結(jié)果。
對(duì)某水電站大壩遙感圖像進(jìn)行分割實(shí)驗(yàn),圖1為傳統(tǒng)FCM分割算法在不同聚類次數(shù)下的效果圖和最終分割效果圖,圖2為改進(jìn)的FCM分割算法在不同聚類次數(shù)下的效果圖和最終分割效果圖。傳統(tǒng)FCM聚類算法和改進(jìn)的FCM聚類算法對(duì)比結(jié)果如表1所示。
圖1 傳統(tǒng)FCM分割算法在不同聚類下的效果以及最終分割效果
圖2 改進(jìn)的FCM分割算法在不同聚類下的效果以及最終分割效果
表1 傳統(tǒng)FCM聚類算法和改進(jìn)的FCM聚類算法對(duì)比
通過實(shí)驗(yàn)可以看出:運(yùn)用改進(jìn)的FCM聚類算法分割后的遙感圖像,分割效果明顯,程序運(yùn)行時(shí)間較短,能夠有效地提高圖像分割的精度與效率。這是因?yàn)楦倪M(jìn)的FCM算法利用圖像直方圖獲取初始聚類中心和聚類數(shù),克服了傳統(tǒng)FCM算法獲取初始聚類中心和聚類數(shù)的隨機(jī)性,同時(shí)又選用了叉熵距離測(cè)度,使得該方法不必依賴于球狀數(shù)據(jù)分布,聚類分割效果較好,邊緣清晰,效率也大大提高。
本研究基于集合論、模糊數(shù)學(xué)的相關(guān)理論,介紹了基于FCM聚類的遙感圖像分割算法,通過引入叉熵距離測(cè)度,對(duì)其做了改進(jìn),提出一種基于改進(jìn)的FCM聚類的遙感圖像分割算法,并進(jìn)行驗(yàn)證實(shí)驗(yàn),結(jié)果表明,該方法具有更高的分割效率和分割精度,解決了傳統(tǒng)方法對(duì)球狀數(shù)據(jù)分布的依賴。
[1] 周家香. Mean Shift遙感圖像分割方法與應(yīng)用研究[D]. 長(zhǎng)沙: 中南大學(xué), 2012.
[2] 賁志偉, 趙勛杰. 基于改進(jìn)的FCM算法提取彩色圖像有意義區(qū)域[J]. 計(jì)算機(jī)工程與設(shè)計(jì), 2010, 31(18):4082- 4084.
[3] 王洪蕾.基于模糊聚類的圖像分割算法研究[D]. 長(zhǎng)沙: 湖南大學(xué), 2008.
[4] QIU C, XIAO J, YU L, et al. A modified interval type- 2 fuzzy C- means algorithm with application in MR image segmentation[J]. Pattern Recognition Letters, 2013, 34(12):1329- 1338.
[5] 賁志偉. 彩色圖像有意義區(qū)域提取算法研究[D]. 蘇州: 蘇州大學(xué), 2010.
(責(zé)任編輯:高 峻)
2016- 09- 19
李勇發(fā)(1990—),男,云南宣威人,碩士研究生,主要研究方向?yàn)閳D像處理與數(shù)據(jù)挖掘,E- mail: 549850669@qq.com。
10.16178/j.issn.0528- 9017.20170348
TP75
A
0528- 9017(2017)03- 0518- 03
文獻(xiàn)著錄格式:李勇發(fā),左小清,楊芳,等. 基于FCM聚類及其改進(jìn)的遙感圖像分割算法[J].浙江農(nóng)業(yè)科學(xué),2017,58(3):518- 520.