【摘 要】Mercer核技術(shù)將實(shí)際問(wèn)題通過(guò)非線(xiàn)性變換轉(zhuǎn)換到高維特征空間,提高了模式的可分性,解決了維數(shù)災(zāi)難問(wèn)題。但是,未經(jīng)過(guò)優(yōu)化的核聚類(lèi)算法不能有效地解決實(shí)際問(wèn)題,如醫(yī)學(xué)圖像分割。為了提高核聚類(lèi)算法速度,人們提出了不同的優(yōu)化方法。結(jié)合KFCM-I的聚類(lèi)效果及KFCM-II的效率,本文提出了一種基于精簡(jiǎn)集的快速核聚類(lèi)算法,該方法優(yōu)于相關(guān)算法,并應(yīng)用在了MRI圖像分割上。通過(guò)對(duì)MRI腦Phantom圖像的分割結(jié)果表明,該方法不但提高了核聚類(lèi)算法的計(jì)算復(fù)雜度,并且通過(guò)參數(shù)調(diào)整達(dá)到較好的分割效果。
【關(guān)鍵詞】核聚類(lèi)算法 高斯核參數(shù)估計(jì) 圖像分割 核磁共振成像
一、引言
對(duì)于腦部MRI圖像分析,精確分割出不同的組織在醫(yī)院研究中扮演著非常重要的角色。過(guò)去幾十年,已經(jīng)有很多方法應(yīng)用于MRI圖像的分割。在這些方法中,模糊聚類(lèi)算法已經(jīng)被證實(shí)為一種有效的圖像分析方法[1,5]。但是,由于受隨機(jī)噪聲及強(qiáng)度偏置場(chǎng)的影響,利用模糊聚類(lèi)算法實(shí)現(xiàn)圖像分割仍是一項(xiàng)困難的工作。為了提高聚類(lèi)效果,可以采用不同的改進(jìn)算法。其中,Mercer核技術(shù)[3,5]具有較好的效果。該算法通過(guò)核映射將輸入模式轉(zhuǎn)換到高維的特征空間(稱(chēng)為核空間),提高了模式的可分性,并在高維特征空間中構(gòu)造線(xiàn)性判別函數(shù)來(lái)實(shí)現(xiàn)輸入空間中的非線(xiàn)性判別函數(shù),同時(shí)巧妙地解決了維數(shù)災(zāi)難問(wèn)題。核聚類(lèi)算法基于上述理論,將映射模式應(yīng)用于傳統(tǒng)的聚類(lèi)算法[3]。雖然該方法優(yōu)于傳統(tǒng)的方法,但是在解決實(shí)際問(wèn)題中相當(dāng)耗時(shí),如MRI圖像分割。為了提高核聚類(lèi)算法效率,人們提出了不同的優(yōu)化算法。例如,文獻(xiàn)[5]利用原像技術(shù)替代映射數(shù)據(jù)的線(xiàn)性和,提出了一種改進(jìn)的聚類(lèi)算法,稱(chēng)為KFCM-II。該方法大大降低了直接核化FCM得到的KFCM-I算法的時(shí)間復(fù)雜度。
區(qū)別于文獻(xiàn)[5]提出的算法,本文提出了一種快速的核聚類(lèi)算法,表示為KFCM-III。該方法不需要所有的映射樣本來(lái)表示聚類(lèi)中心。通過(guò)對(duì)醫(yī)學(xué)MRI圖像的分割結(jié)果證明了算法的有效性。
二、FCM、KFCM-I以及KFCM-II
(一)模糊聚類(lèi)算法(FCM)
FCM(Fuzzy C-Means)是一種無(wú)監(jiān)督的聚類(lèi)方法,可以將個(gè)輸入數(shù)據(jù)(向量)聚成()類(lèi)。該方法可以通過(guò)對(duì)目標(biāo)函數(shù)的最小化獲得:
表明數(shù)據(jù)屬于第類(lèi),并且滿(mǎn)足。表明第類(lèi)的聚類(lèi)中心,并且在最小化公式(1)的過(guò)程中,表示為所有輸入樣本的加權(quán)和。
使用拉格朗日乘子法,對(duì)公式(1)最小化,分別求出和兩個(gè)迭代方程。聚類(lèi)過(guò)程是對(duì)這兩個(gè)方程進(jìn)行循環(huán)迭代,直到收斂。將表示為,最終被歸為第類(lèi),從而將模糊聚類(lèi)問(wèn)題轉(zhuǎn)換為一個(gè)硬分類(lèi)問(wèn)題。
(二)Mercer核及KFCM-I
Mercer隱含著對(duì)應(yīng)一個(gè)從原始空間到一個(gè)高維核空間的映射,提高了模式的可分性。在核特征空間的模糊聚類(lèi),稱(chēng)為KFCM-I(核化的FCM)。該聚類(lèi)方法可以通過(guò)最小化公式(1)的核化版本來(lái)實(shí)現(xiàn):
式中是第類(lèi)的核聚類(lèi)中心。類(lèi)似地,兩個(gè)迭代方程可以描述如下:
因?yàn)楹瘮?shù)是隱性的,公式(3)和(4)不能直接進(jìn)行計(jì)算,需要采用另外一種求解方法。故不能通過(guò)表示成映射模式的加權(quán)和為顯式得到。
Mercer核方法提供了一種巧妙地方法解決上述問(wèn)題,表示為,滿(mǎn)足如下條件:
因?yàn)楣剑?)可以進(jìn)行顯式地展開(kāi),那么就可以避開(kāi)直接計(jì)算公式(4)。聚類(lèi)初始化后,可以迭代計(jì)算公式(3)和公式(6)直至收斂,將模糊聚類(lèi)結(jié)果轉(zhuǎn)換為一個(gè)硬分類(lèi)。
從上面可以不難看出,公式(6)是整個(gè)計(jì)算過(guò)程中最復(fù)雜的部分,計(jì)算復(fù)雜度為,為迭代的次數(shù),在大多數(shù)情況下大于10。
雖然KFCM-I提供了一種有效的聚類(lèi)方法,并且可以用于解決維數(shù)災(zāi)難問(wèn)題。但計(jì)算復(fù)雜度過(guò)高,很難用于實(shí)際應(yīng)用中。
(三)KFCM-II及原像技術(shù)
因?yàn)楣剑?)計(jì)算復(fù)雜度較高,為了提高KFCM-I的效率,需要對(duì)其簡(jiǎn)化。為了解決該問(wèn)題,文獻(xiàn)[5]通過(guò)最小化如下目標(biāo)函數(shù)提出一種新的聚類(lèi)算法:
KFCM-II算法基本思想是基于可以替換為,(),也就是說(shuō)的原像存在。如果該假設(shè)成立,使用拉普拉斯乘子法,迭代方程可以得到簡(jiǎn)化。
不幸的是,使用替代并不恰當(dāng)。文獻(xiàn)[3]指出對(duì)于高斯核不存在映射數(shù)據(jù)加權(quán)和的原像。原像估計(jì)技術(shù)可能對(duì)聚類(lèi)模型帶來(lái)一些缺陷。例如,因?yàn)樵谥酗@式獲得,所以KFCM-II從特征空間退化為中對(duì)應(yīng)的一個(gè)聚類(lèi)。
三、KFCM-III及精簡(jiǎn)集
(一)核聚類(lèi)平方擴(kuò)展的簡(jiǎn)化
為了克服KFCM-II模型的缺陷,同時(shí)保持聚類(lèi)的有效性?;诰?jiǎn)集概念,本文提出一種新的聚類(lèi)方法,稱(chēng)為KFCM-III。
不難發(fā)現(xiàn),KFCM-I和KFCM-II使用所有輸入樣本來(lái)表示聚類(lèi)中心(參見(jiàn)公式(4)和(11)),但該公式并不是最優(yōu)的。本文僅使用部分典型樣本來(lái)表示聚類(lèi)中心,我們將第類(lèi)的典型樣本標(biāo)記為精簡(jiǎn)集,它是的一個(gè)子集。所以,對(duì)于由類(lèi)組成的整體,則存在個(gè)精簡(jiǎn)集。如果我們定義如下公式,則核聚類(lèi)中心可以表示為精簡(jiǎn)集中元素的線(xiàn)性和,。如果選擇的恰當(dāng),則能得到較好的聚類(lèi)結(jié)果。直觀(guān)上,不應(yīng)過(guò)大或者過(guò)小,并且精簡(jiǎn)集的選擇應(yīng)當(dāng)保留足夠的樣本可分性。那么可以描述如下:
由公式(10)和公式(6)比較可知,KFCM-III相對(duì)KFCM-I的效率得到了大大的提高。
(二)精簡(jiǎn)集參數(shù)
從上述分析我們可以看出,KFCM-III的性能很大程度上依賴(lài)于精簡(jiǎn)集的選擇是否得當(dāng)。對(duì)于特定類(lèi),我們選擇具有較多成員的樣本作為典型集。類(lèi)似于公式(7)的加權(quán)系數(shù),我們定義系數(shù)如下:
對(duì)于核聚類(lèi),高斯核參數(shù)的估計(jì)也是一個(gè)非常重要的問(wèn)題。不同于文獻(xiàn)[5]使用的反復(fù)試驗(yàn)的方法,我們將設(shè)置為高斯指數(shù)函數(shù)的拐點(diǎn),滿(mǎn)足如下公式:
四、實(shí)驗(yàn)結(jié)果及分析
(一)合成和MRI圖像分割實(shí)驗(yàn)
為了驗(yàn)證本文算法的分割效果,本文對(duì)MR Phantom圖像進(jìn)行了分割實(shí)驗(yàn),并對(duì)實(shí)驗(yàn)結(jié)果進(jìn)行了分析。該數(shù)據(jù)提供了定量比較分割準(zhǔn)確性的標(biāo)準(zhǔn)分割結(jié)果,并允許在不同的噪聲和偏置場(chǎng)[2]條件下的比較分析。
圖1:利用KFCM-III對(duì)T1加權(quán)的三維MRI phantom數(shù)據(jù)的分割結(jié)果:(a)原始圖像;(b)原始圖像的分割結(jié)果;(c)均值濾波圖像的分割結(jié)果;(d)中值濾波圖像的分割結(jié)果。
實(shí)驗(yàn)時(shí),目標(biāo)函數(shù)中的隸屬度指數(shù)取,并且為了更清楚有效地描述實(shí)驗(yàn)結(jié)果,我們選取像素的灰度向量作為輸入模式。為了比較相關(guān)算法的性能,我們分別采用KFCM-I、KFCM-II和KFCM-III對(duì)原始圖像、中值濾波圖像和均值濾波圖像進(jìn)行分割,其中濾波模板大小為。
在第一個(gè)實(shí)驗(yàn)中,我們選取T1加權(quán)的3D腦部phantom 數(shù)據(jù),將感興趣區(qū)域分割為白質(zhì)(WM)、灰質(zhì)(GM)和脊髓液(CSF)。在該實(shí)驗(yàn)中,使用KFCM-I(未采用預(yù)分類(lèi)策略)不能在合理的時(shí)間內(nèi)實(shí)現(xiàn)對(duì)圖像的分割,對(duì)于KFCM-II和KFCM-III獲得相似的實(shí)驗(yàn)結(jié)果。
圖1給出利用KFCM-III得到的三維體積冠狀切片的分割結(jié)果。目標(biāo)phantom大小為像素,器官組織的分辨率為. 分割區(qū)域使用不同的灰度表示。因?yàn)镵FCM-II與KFCM-III具有相似的結(jié)果,圖中并未給出KFCM-II的分割結(jié)果。
但是,定量比較結(jié)果表明如果精簡(jiǎn)集選擇得當(dāng),相對(duì)KFCM-II,KFCM-III將得到好的結(jié)果。
表1給出利用KFCM-II和KFCM-III對(duì)三維MRI腦部phantom數(shù)據(jù)的分割精度。主要包括在不同噪聲水平和不同強(qiáng)度的偏置場(chǎng)下,對(duì)原始圖像、均值濾波圖像及中值濾波圖像的分割結(jié)果。
分割精度定義為分割正確的像素個(gè)數(shù)除以所有的像素個(gè)數(shù)。符號(hào)pnXrfY(例如pn9rf20)表示在X%和Y%偏置場(chǎng)下圖像的分割結(jié)果。為了描述上的方便,我們?cè)谙嗤?jiǎn)集參數(shù)下,利用KFCM-III進(jìn)行分割。例如,在表1中,表明對(duì)于三個(gè)聚類(lèi)類(lèi)而言,精簡(jiǎn)集中數(shù)據(jù)的個(gè)數(shù)都等于30。實(shí)際上,精簡(jiǎn)集參數(shù)可以不同并且可以選擇更合理一點(diǎn)。關(guān)于參數(shù)選擇有待進(jìn)一步的研究。從表1中可以看出,即使所有的參數(shù)都相同,KFCM-III仍能得到好于KFCM-II的分割結(jié)果。
(二)執(zhí)行時(shí)間效率
KFCM-III的計(jì)算復(fù)雜度和時(shí)間效率依賴(lài)于精簡(jiǎn)集參數(shù)的選擇。如果所有參數(shù)設(shè)置為最大,則KFCM-III轉(zhuǎn)化為KFCM-I. 一般來(lái)說(shuō),KFCM-III相對(duì)KFCM-II,計(jì)算有點(diǎn)復(fù)雜。但是,在調(diào)整好的參數(shù)下,取得更好的分割效果。
圖5給出聚類(lèi)過(guò)程中一次迭代的計(jì)算時(shí)間,大約為的平方函數(shù),驗(yàn)證了上述的理論分析。
五、結(jié)論
本文提出了一種基于快速核聚類(lèi)算法(稱(chēng)為KFCM-III),并用于MRI圖像的分割。提出算法使用精簡(jiǎn)集概念來(lái)加速聚類(lèi)速度。本文中,KFCM-I和KFCM-II可以看著KFCM-III的兩個(gè)特例,在調(diào)整好的參數(shù)下,KFCM-III性能優(yōu)于KFCM-I和KFCM-II. 該提出算法不但降低了計(jì)算復(fù)雜度,并且提高了聚類(lèi)效果。但是,參數(shù)的選擇需要進(jìn)一步的研究。通過(guò)對(duì)MRI圖像分割結(jié)果表明,該方法優(yōu)于相關(guān)算法,達(dá)到較好的分割效果。
參考文獻(xiàn):
[1]Weiling Cai, Songcan Chen, and Daoqiang Zhang. Fast and robust fuzzy C-means clustering algorithms incorporating local information for image segmentation. Pattern Recognition, 40(3):825-838, 2007.
[2]D Louis Collins, Alex P Zijdenbos, Vasken Kollokian, John G Sled, Noor J Kabani, Colin J Holmes, and Alan C Evans. Design and construction of a realistic digital brain phantom. IEEE Transactions on Medical Imaging, 17(3):463-468, 1998.
[3]Bernhard Scholkopf, Sebastian Mika, Chris JC Burges, Philipp Knirsch, K-R Muller, Gunnar Ratsch, and Alex J Smola. Input space versus feature space in kernel-based methods. Neural Networks, IEEE Transactions on, 10(5):1000-1017, 1999.
[4]Uros Vovk, Franjo Pernus, and Bostjan Likar. A review of methods for correction of intensity inhomogeneity in MRI. IEEE Transactions on Medical Imaging, 26(3):405-421, 2007.
[5]Dao-Qiang Zhang and Song-Can Chen. A novel kernelized fuzzy C-means algorithm with application in medical image segmentation. Artificial intelligence in medicine, 32(1):37-50, 2004.