王燕鳳,馬 寧
(1.西北民族大學(xué) 數(shù)學(xué)與計算機(jī)科學(xué)學(xué)院,甘肅 蘭州730030;2.西北民族大學(xué) 中國民族信息技術(shù)研究院,甘肅 蘭州730030)
圖像作為人類感知世界的視覺基礎(chǔ),已成為人類獲取信息、表達(dá)信息和傳遞信息的重要手段.統(tǒng)計表明:在人類獲取的各種信息中,80%以上的信息來自視覺信息,或者說圖像信息,這包括符號、文本、圖形、圖像、視頻等信息 .隨著計算機(jī)技術(shù)和數(shù)字圖像技術(shù)的不斷成熟,圖像作為客觀世界最為直接的信息載體,已成為越來越重要的研究對象.
在計算機(jī)視覺和圖像分析中,如何把目標(biāo)物體從圖像中有效分割出來,一直是個難題之一,它決定圖像的最終分析質(zhì)量和模式識別的判別結(jié)果.圖像分割是指將圖像中具有特殊意義的不同區(qū)域分開來,并使這些區(qū)域相互不相交,且每個區(qū)域應(yīng)滿足特定區(qū)域的一致性條件[1].圖像一旦被分割,就可作進(jìn)一步的處理,如基于內(nèi)容的圖像檢索、分類及識別等.因此,圖像分割是圖像處理和模式識別中的一個重要研究領(lǐng)域.目前圖像分割的算法主要有閾值分割法、邊緣提取法、區(qū)域分割法、分水嶺分割法等,這些分割算法各有優(yōu)缺點(diǎn).近年來,許多研究人員提出用聚類算法來分割圖像,并取得了較好的實驗結(jié)果.但如何初始劃分(分類)樣本以及選擇代表點(diǎn)將直接影響分割的效果[2].
由于彩色圖像的大量存在,對彩色圖像的分割顯得尤為重要.本文從統(tǒng)計模式識別的角度出發(fā),將彩色圖像的各個像素點(diǎn)的色彩分量值看作待分類樣本,進(jìn)行迭代動態(tài)聚類.ISODATA算法屬于一種動態(tài)聚類算法[3],較C-均值算法有更好的適應(yīng)性和靈活性.由于彩色圖像含有豐富的色彩信息,從多個信息面描述了圖像中的物體特征,能夠充分發(fā)揮非監(jiān)督聚類算法的優(yōu)勢 .根據(jù)色彩提供的大量信息自動形成各個聚類,各個聚類能較好地與圖像中本來物體相吻合,并且在聚類的分析過程中就完成了物體的標(biāo)號,達(dá)到分割的目的.
ISODATA 算法是統(tǒng)計模式識別中非監(jiān)督動態(tài)聚類算法中的一種[4].通過設(shè)定初始聚類中心和聚類數(shù),定義相似度準(zhǔn)則函數(shù)將全部樣本調(diào)整完畢后重新計算樣本均值作為新的聚類中心 .在調(diào)整樣本過程中完成聚類分析,動態(tài)地進(jìn)行類的“合并”和“分裂”,從而得到類數(shù)比較合理的各個聚類.ISODATA作為一種動態(tài)聚類算法[5],要解決如下問題:
1)確定樣本間的相似度函數(shù)D(x,y)=‖x-y‖.
2)確定評價聚類結(jié)果質(zhì)量的準(zhǔn)則函數(shù),在這里采用誤差平方和準(zhǔn)則函數(shù):
3)給定某個初始分類和一些初始條件,然后應(yīng)用迭代算法找出使準(zhǔn)則函數(shù)取得最小值的最好聚類結(jié)果.
算法可按如下幾步進(jìn)行:
① 確定初始控制參數(shù):K表示期望得到的聚類數(shù);θN表示個聚類中最少樣本數(shù);θs表示標(biāo)準(zhǔn)偏差參數(shù);θc表示類間合并參數(shù);L表示每次迭代允許合并的最大聚類對數(shù);I表示允許迭代的次數(shù).
② 按定義的相似度準(zhǔn)則函數(shù),將樣本歸入最有可能的類.
③ 根據(jù)步驟②的分類結(jié)果更新聚類中心.
④ 計算各類中每個樣本與其中心的相似度以及所有樣本與其相應(yīng)聚類中心的平均相似度δ,每個聚類內(nèi)樣本分量的標(biāo)準(zhǔn)偏差.
⑤ 根據(jù)步驟④的計算結(jié)果決定是否進(jìn)行分裂以及分裂策略.
⑥ 根據(jù)當(dāng)前聚類中心之間的相互相似度決定是否進(jìn)行合并以及合并策略.
⑦ 若這是最后一次迭代,則程序終止;若需按經(jīng)驗改變參數(shù),則轉(zhuǎn)向步驟①;若不需要改變參數(shù),則轉(zhuǎn)向步驟②.
ISODATA算法的優(yōu)點(diǎn)是算法效率高、所需信息量較少,缺點(diǎn)是存在較大的不確定性,因為它是非監(jiān)督的分類之前沒有一定類別的樣本集,類別數(shù)未知.
根據(jù)對ISODATA算法的分析,利用Matlab編寫程序,實現(xiàn)了對一幅典型圖像進(jìn)行分割實驗.效果如圖1所示.
圖1 基于ISODATA算法的圖像分割
本章主要采用ISODATA算法實現(xiàn)圖像分割的方法進(jìn)行了詳細(xì)的敘述,并利用Matlab編寫程序?qū)崿F(xiàn)了基于ISODATA算法的圖像分割,對以后研究圖像分割的改進(jìn)工作打下了基礎(chǔ).
[1]徐曉麗 .基于聚類分析的圖像分割算法研究[D].哈爾濱:哈爾濱工程大學(xué),2012.
[2]片兆宇.圖像分割若干問題的研究與應(yīng)用[D].東北大學(xué),2009.
[3]葛宏立.面向類的圖像分割方法研究[D].北京林業(yè)大學(xué),2004.
[4]曹雪,柯長青.基于對象級的高分辨率遙感影像分類研究[J].遙感信息,2006,5:27-30.
[5]李石華,王金亮等.遙感圖像分類方法研究綜述[J].國土資源遙感,2005,2:2-6.