蘇坡, 楊建華, 薛忠
(1.西北工業(yè)大學(xué) 自動(dòng)化學(xué)院, 陜西 西安 710129; 2.Houston Methodist研究所, 美國(guó) 休斯頓 77030)
腦膠質(zhì)瘤(glioblastoma multiforme, GBM)是腦腫瘤中最常見的、死亡率最高的一種惡性腫瘤。統(tǒng)計(jì)表明,40%的腦腫瘤患者為腦膠質(zhì)瘤。腦膠質(zhì)瘤患者術(shù)后存活時(shí)間的中位數(shù)僅為8個(gè)月,而5年以上的存活率幾乎為零[1]。GBM在多模態(tài)MRI圖像中呈現(xiàn)出一片異質(zhì)的腫瘤區(qū)域。這片區(qū)域通常包括3個(gè)部分:壞死腫瘤(necrosis)、活動(dòng)腫瘤(enhanced tumor)以及腫瘤擠壓周圍正常腦組織所形成的水腫(edema)。由于GBM腫瘤在組織形態(tài)上的復(fù)雜性與特殊性,單模態(tài)MRI無(wú)法清晰地反映GBM的不同組織結(jié)構(gòu)。相比之下,多模態(tài)MRI圖像中含有豐富的組織結(jié)構(gòu)信息,被廣泛用于GBM的診斷和治療。本文的多模態(tài)MRI主要包括T2(T2加權(quán)成像)、T1PRE(T1加權(quán)成像)、T1POST(T1增強(qiáng)成像)和FLAIR (液體衰減反轉(zhuǎn)成像)。在不同的模態(tài)下,GBM組織圖像呈現(xiàn)出不同的特征:活動(dòng)腫瘤在T1POST呈現(xiàn)高信號(hào),壞死部分在T1POST呈現(xiàn)低信號(hào),而水腫部分在T2和FLAIR呈現(xiàn)高信號(hào)。GBM的分割是指根據(jù)這些特征,把GBM組織從正常的腦組織中標(biāo)記或分割出來(lái)。
文獻(xiàn)中,基于像素或者體素的分割算法廣泛應(yīng)用于GBM的分割。這類算法的基本思想是根據(jù)每個(gè)像素在多模態(tài)圖像上亮度信息、紋理信息等把該像素點(diǎn)分類到相應(yīng)的類別中。分類的算法包括無(wú)監(jiān)督的聚類和有監(jiān)督的學(xué)習(xí)。例如,Clark等[2]提出了一種基于FCM(fuzzy C-means algorithm)的模糊均值聚類的算法。該算法以多模態(tài)圖像的灰度作為特征向量,首先利用FCM對(duì)所有體素點(diǎn)進(jìn)行聚類得到初始的分類,然后根據(jù)對(duì)稱性,灰度分布等先驗(yàn)知識(shí)對(duì)初始分類進(jìn)行優(yōu)化,得到最終的分割結(jié)果。由于FCM聚類時(shí),沒(méi)有考慮空間鄰域信息,并且GBM組織的灰度分布會(huì)產(chǎn)生重疊,因此容易產(chǎn)生誤分割。
基于圖形分割的算法[3-4]現(xiàn)在也非常流行。這類算法用圖的頂點(diǎn)來(lái)描述圖像的像素,用圖的邊描述2個(gè)像素的相似性,由此形成一個(gè)網(wǎng)絡(luò)圖,然后通過(guò)解決能量最小化問(wèn)題把圖分割成子網(wǎng)絡(luò)圖,使不同子網(wǎng)絡(luò)圖之間的差異和同一子網(wǎng)絡(luò)圖內(nèi)部的相似性達(dá)到最大。這類算法通常需要解決一個(gè)求解廣義特征向量問(wèn)題,當(dāng)圖像比較大時(shí),這類算法會(huì)遭遇計(jì)算復(fù)雜度大的問(wèn)題。除了以上2類算法,基于Level set[5]的分割算法也廣泛應(yīng)用于GBM分割,但是由于GBM組織灰度不均勻,并且GBM組織之間經(jīng)常沒(méi)有明顯的邊界,采用這類算法容易出現(xiàn)邊緣泄露的問(wèn)題。
最近,超像素或超體素(supervoxel)[6-7]引起了很大的關(guān)注,基于超像素和超體素的分割算法也成為研究熱點(diǎn)。相比于傳統(tǒng)的像素和體素,超像素和超體素具有計(jì)算效率高,符合人類視覺(jué)感知,能高效表示圖像信息等優(yōu)點(diǎn)。
為了充分利用超像素的優(yōu)點(diǎn),提高GBM分割的精確性和魯棒性,本文提出了基于超像素的多模態(tài)MRI GBM分割算法。首先通過(guò)帶加權(quán)距離的局部k-均值聚類算法,把多模態(tài)MRI圖像過(guò)分割成一系列均勻、緊湊并能很好地貼合圖像邊緣的超像素。然后,利用動(dòng)態(tài)區(qū)域合并算法對(duì)超像素進(jìn)行逐步合并。最后通過(guò)后處理得到GBM的最終分割結(jié)果。實(shí)驗(yàn)表明本文算法能取得較好的分割效果。
圖1給出本文的算法框架。算法包含4步:①圖像預(yù)處理,包括多模態(tài)圖像的共同配準(zhǔn)和去腦殼;②利用本文提出的帶加權(quán)距離的局部k-均值聚類算法把多模態(tài)圖像分割為一系列亮度均勻并能很好地貼合圖像邊緣的超像素;③利用動(dòng)態(tài)區(qū)域合并算法對(duì)②產(chǎn)生的超像素進(jìn)行合并。通過(guò)區(qū)域合并生成若干塊均勻的有意義的區(qū)域(合并后的不同區(qū)域用不同的顏色表示,見圖1);④根據(jù)亮度分布等對(duì)合并后的區(qū)域進(jìn)行后處理,最終完成對(duì)GBM的分割。
圖1 算法框架
預(yù)處理包括多模態(tài)圖像的共同配準(zhǔn)(co-registration)和去腦殼。圖像的共同配準(zhǔn)保證多模態(tài)圖像同一位置的像素對(duì)應(yīng)腦部同一組織。本文利用FSL[8]的FLIRT工具完成對(duì)多模態(tài)MRI圖像的共同配準(zhǔn)。選取T2作為參考圖像,把其他模態(tài)的圖像配準(zhǔn)到T2上。配準(zhǔn)采用剛性變換并以互信息量作為圖像相似性測(cè)度。
去腦殼是腦圖像處理的一個(gè)常見步驟。它一方面可以減少后續(xù)處理的計(jì)算量,另一方面也會(huì)減少非腦實(shí)質(zhì)組織對(duì)后續(xù)處理的影響。本文利用一個(gè)模板圖像和它去腦殼后的圖像,通過(guò)配準(zhǔn)的方法實(shí)現(xiàn)去腦殼操作。首先把該模板腦圖像通過(guò)仿射變換配準(zhǔn)到T2上。接著用第一步配準(zhǔn)產(chǎn)生的仿射變換矩陣對(duì)去腦殼后的模板圖像進(jìn)行變換就實(shí)現(xiàn)了對(duì)T2的去腦殼操作。
在文獻(xiàn)[6]中,Achanta等提出了一種基于局部k-均值聚類算法,把彩色圖像過(guò)分割為一系列均勻、緊湊并能很好貼合圖像邊緣的超像素。該算法的基本思想是根據(jù)像素點(diǎn)的圖像特征和空間位置特征定義一個(gè)新的距離函數(shù),然后根據(jù)新距離函數(shù)對(duì)像素點(diǎn)進(jìn)行局部的k-均值聚類從而產(chǎn)生超像素。該算法主要輸入?yún)?shù)為K,即待生成的超像素的個(gè)數(shù)。首先,在待分割的彩色圖像均勻分布K個(gè)初始聚類中心點(diǎn)。根據(jù)K和整個(gè)圖像像素點(diǎn)總數(shù)目N可以計(jì)算出初始聚類中心點(diǎn)之間的間距S:
(1)
然后,選取像素在CIELAB顏色空間的顏色值[lab]T和自身空間位置[xy]T組成5維特征向量[labxy]T。與傳統(tǒng)的k-均值聚類采用歐式距離作為相似性測(cè)度不同,Achanta定義了一個(gè)新的相似性測(cè)度,該相似性測(cè)度考慮了所產(chǎn)生超像素的大小。新的相似性測(cè)度定義像素點(diǎn)i到第k個(gè)聚類中心的距離為
(2)
式中
(3)
(4)
(liaibixiyi)T表示第i個(gè)像素的特征向量,i∈[1,N]。(lkakbkxkyk)T表示第k個(gè)聚類中心的特征向量,k∈[1,K]。df為像素點(diǎn)i到第k個(gè)聚類中心的圖像特征距離,測(cè)量2個(gè)像素亮度特征的相似性。dxy為像素i到第k個(gè)聚類中心的空間距離,測(cè)量2個(gè)像素空間位置的相似性。S為公式(1)中初始聚類中心的之間的空間間隔,它的引入相當(dāng)于引入了超像素大小的信息。參數(shù)m控制所產(chǎn)生超像素的緊湊程度。m越大,空間距離dxy占主導(dǎo),所產(chǎn)生的超像素就越緊湊;反之,m越小,亮度特征距離df占據(jù)主導(dǎo),產(chǎn)生的超像素能更好地貼合圖像邊緣,但其大小和形狀不是很緊湊。傳統(tǒng)的k-均值聚類搜索范圍為整個(gè)圖像空間,為了減少k-均值聚類的計(jì)算復(fù)雜度,Achanta限定搜索范圍為聚類中心周圍2S×2S區(qū)域。這就是該算法被稱為局部k-均值聚類的原因。
本文對(duì)Achanta的算法進(jìn)行了擴(kuò)展,實(shí)現(xiàn)從多模態(tài)MRI產(chǎn)生超像素。選取像素在T2、T1PRE、FLAIR和T1POST的亮度值[f1f2f3f4]T和空間位置[xy]T組成6維特征向量[f1f2f3f4xy]T。為了產(chǎn)生更好的超像素,我們對(duì)Achanta算法進(jìn)行改進(jìn),提出了一種帶加權(quán)距離的局部k-均值聚類。我們的依據(jù)是不同模態(tài)的圖像對(duì)GBM分割的貢獻(xiàn)不同,如T2和FLAIR含有比較多的水腫信息,T1POST含有較多的GBM壞死部分和活動(dòng)部分信息。對(duì)T1POST模態(tài)進(jìn)行強(qiáng)調(diào),定義新的圖像特征距離df:
(5)
參數(shù)ω(0<ω<1)為T1POST模態(tài)的權(quán)重,ω=0.25時(shí)各個(gè)模態(tài)圖像的權(quán)重相等(標(biāo)準(zhǔn)局部k-均值聚類),ω>0.25時(shí)T1POST模態(tài)占圖像特征距離的比重大于其他模態(tài)。ω的引入可以實(shí)現(xiàn)對(duì)超像素進(jìn)行細(xì)調(diào),使超像素在保持緊湊性的同時(shí)還能更好地貼合GBM活動(dòng)腫瘤和壞死部分的邊緣??臻g距離dxy的選取跟Achanta的算法一致。
圖2 采用標(biāo)準(zhǔn)局部k-均值聚類和帶加權(quán)距離的局部k-均值聚類產(chǎn)生超像素的對(duì)比圖
圖2給出采用標(biāo)準(zhǔn)局部k-均值聚類(等權(quán)重距離)和加權(quán)距離k-均值聚類產(chǎn)生超像素的例子。其中設(shè)置K=300,m=70。從圖2的箭頭所指的超像素可以看出采用帶加權(quán)距離k-均值聚類算法產(chǎn)生的超像素能更好地貼合GBM壞死部分和活動(dòng)腫瘤部分的邊緣。
上一節(jié)中,多模態(tài)圖像被過(guò)分割成一系列均勻、緊湊并能很好貼合圖像邊緣的超像素。如圖3所示,多模態(tài)MRI被過(guò)分割成一系列超像素,參數(shù)設(shè)置K=600,m=70,ω=0.4。圖3第一排圖像依次為T2、T1PRE、FLAIR和T1POST模態(tài)圖像;第二排和第三排顯示用本文算法產(chǎn)生的超像素。
圖3 多模態(tài)MRI圖像被過(guò)分割成超像素
我們采用區(qū)域合并的方法對(duì)超像素進(jìn)行處理進(jìn)而實(shí)現(xiàn)對(duì)GBM的分割。為了方便起見,用區(qū)域鄰接圖(region adjacency graph, RAG)模型描述所產(chǎn)生的超像素。令G(V,E)表示一個(gè)無(wú)向圖,vi∈V(i=1,2,…,M)為圖的一個(gè)頂點(diǎn),代表第i個(gè)超像素。E?V×V表示相鄰的2個(gè)頂點(diǎn)的邊,邊的權(quán)重w(vi,vj)表示相鄰的2個(gè)超像素i和j之間的相似度。
區(qū)域合并的過(guò)程就是根據(jù)區(qū)域鄰接圖頂點(diǎn)的相似性對(duì)頂點(diǎn)進(jìn)行合并同時(shí)對(duì)相應(yīng)的數(shù)據(jù)進(jìn)行更新的過(guò)程。區(qū)域合并算法成功的關(guān)鍵在于能否解決2個(gè)問(wèn)題:①設(shè)計(jì)區(qū)域合并的規(guī)則,即2個(gè)區(qū)域滿足什么樣的條件就對(duì)其合并;②設(shè)計(jì)合并停止條件,即區(qū)域合并到什么程度就停止區(qū)域合并。針對(duì)這2個(gè)問(wèn)題,研究者提出了不同的區(qū)域合并算法。Nock等[10]采用相似性統(tǒng)計(jì)檢驗(yàn)方法實(shí)現(xiàn)區(qū)域合并:若2個(gè)相鄰的區(qū)域具有統(tǒng)計(jì)意義上的相似性,則對(duì)這2個(gè)區(qū)域進(jìn)行合并,反之不進(jìn)行合并。然而現(xiàn)有的大部分區(qū)域合并算法均存在容易產(chǎn)生過(guò)合并,欠合并或者兩者混合的情況。針對(duì)現(xiàn)有區(qū)域合并算法的不足,Peng等[10]提出了一種動(dòng)態(tài)區(qū)域合并算法并證明了該算法產(chǎn)生的區(qū)域合并結(jié)果能保持一定的全局屬性。該算法把區(qū)域合并看做是一個(gè)由相似性度量和一致性度量2個(gè)部分組成的推斷問(wèn)題。相似性度量解決尋找候選合并區(qū)域的問(wèn)題,一致性度量則決定是否對(duì)這些候選區(qū)域進(jìn)行合并。在一致性度量部分,Peng引入序貫概率比檢驗(yàn)(sequential probability ratio test, SPRT)方法,通過(guò)SPRT來(lái)確定候選區(qū)域是否具備一致性。實(shí)驗(yàn)結(jié)果表明Peng的算法優(yōu)于其他區(qū)域合并算法。本文采用Peng的動(dòng)態(tài)區(qū)域合并算法來(lái)實(shí)現(xiàn)區(qū)域合并。定義區(qū)域合并謂詞P為:
P(v1,v2)=
v1和v2表示RAG中2個(gè)相鄰的超像素v1和v2。w(vi,vj)為RAG 2個(gè)頂點(diǎn)vi和vj的相似度。Ω1和Ω2分別表示與v1和v2相鄰的超像素的集合。謂詞P(v1,v2)表示當(dāng)且僅當(dāng)同時(shí)滿足條件(a):v1和v2互為最相似的鄰居;條件(b):v1和v2具有一致性時(shí)對(duì)v1和v2進(jìn)行合并,否則不進(jìn)行合并。條件(b)暗含停止區(qū)域合并的條件。若沒(méi)有條件(b),所有的超像素最終將合并成為一個(gè)區(qū)域。定義2個(gè)超像素vi和vj相似度w(vi,vj)為:
(6)
N(vi)和N(vj)分別表示超像素vi和vj中所含像素的個(gè)數(shù)。vi和vj均為向量,分別表示超像素vi和vj在4種模態(tài)圖像的亮度平均值向量。
西北工業(yè)大學(xué)學(xué)報(bào)2014年3期