龐學(xué)明,張澤偉,侯愛林,孫浩然
(1.天津醫(yī)科大學(xué)總醫(yī)院放射科,天津 300052;2.天津醫(yī)科大學(xué)醫(yī)學(xué)影像學(xué)院,天津 300203)
肺癌是對當(dāng)今人類健康危害最大的惡性腫瘤之一,美國癌癥協(xié)會(American Cancer Society,ACS)已指出[1],肺癌現(xiàn)已成為全世界范圍發(fā)病率最高的惡性腫瘤,也是目前已知的確診后死亡率最高的癌癥。早期發(fā)現(xiàn)和治療肺癌可以提高患者的生存率。肺癌在早期時一般表現(xiàn)為肺結(jié)節(jié),其中包括磨玻璃型肺結(jié)節(jié)(ground glass opacity,GGO)。一些研究表明,GGO型肺結(jié)節(jié)發(fā)展為肺癌的概率要高于實性肺結(jié)節(jié)[2]。隨著低劑量多層螺旋CT的出現(xiàn),它已經(jīng)成為肺癌早期診斷的重要工具,但是醫(yī)生所需分析觀察的圖像數(shù)量也在急劇增加。為了減輕醫(yī)生的工作量,且?guī)椭麄冎庇^有效地識別病灶,降低漏診和誤診的可能,計算機輔助診斷(computer aided diagnosis,CAD)技術(shù)應(yīng)運而生。研究表明CAD對于提高診斷準確率、降低漏診率以及提高診斷效率能夠起到重要的作用。相比近些年國內(nèi)外針對實性結(jié)節(jié)的檢測研究已日趨成熟,針對GGO型肺結(jié)節(jié)的研究卻很少;然而近些年來,GGO型肺結(jié)節(jié)的發(fā)病率在逐年上升。其中通過CAD診斷GGO型肺結(jié)節(jié)的最關(guān)鍵步驟是對GGO型肺結(jié)節(jié)進行高精確度的分割。因此我們提出了一個支持向量機和隨機游走算法相結(jié)合的分割方法。該方法與傳統(tǒng)方法相比較,可以實現(xiàn)自動化分割肺結(jié)節(jié),避免人工選擇種子點的工作量,可以在進一步提高準確性的同時能夠提高效率。
1.1 資料 回顧性分析2016年5月-2017年3月行CT檢查發(fā)現(xiàn)GGO型肺結(jié)節(jié)的患者,共收集符合條件的GGO型結(jié)節(jié)200個,平均直徑為(2.2±0.5)cm,采集方法均使用64排螺旋CT(GE Light Speed)進行,掃描范圍自胸廓入口至肺底?;颊咭淮挝鼩夂笃翚馔瓿扇螔呙?,螺旋掃描方式,電壓120 kV,電流 300 mA,螺距 1.375:1,層厚 5 mm,機架旋轉(zhuǎn)一周時間 0.4 s,顯示野(field of view,FOV)360 mm,圖像矩陣512×512,默認重建算法為標準算法,重建1.25 mm層厚軸位圖像?;緦崿F(xiàn)圖像體素各相同性以確保容積分割的準確性。
1.2 方法
1.2.1 支持向量機原理 支持向量機(support vector machine,SVM)是 Vapnik 等[3]在 1995 年提出的一種新的模式識別技術(shù)。具有結(jié)構(gòu)簡單、全局最優(yōu)、泛化能力好、計算復(fù)雜度低等優(yōu)點,且具有較強的高維樣本處理能力,在圖像分類等模式識別領(lǐng)域得到了廣泛的應(yīng)用。支持向量機是基于統(tǒng)計學(xué)習(xí)的VC維理論和結(jié)構(gòu)風(fēng)險最小原理,基本思想是構(gòu)造一個最優(yōu)分類超平面作為決策面[4],使得兩類標簽之間的分類間隔最大,然后通過求解二次規(guī)劃尋優(yōu)的對偶問題來尋找最優(yōu)分類超平面。
假設(shè)一個二分類的訓(xùn)練樣本集合(χ(i),y(i),i=1,2,…,n),x∈Rm是m維的特征向量,相應(yīng)的分類標記為y∈{1,-1}的分類標簽。SVM在高維特征空間中求最優(yōu)間隔分類超平面為:
式中:ξi為松弛項,是在訓(xùn)練線性不可分樣本時引入的。C是一個常數(shù),稱為懲罰因子,值越大說明錯誤分類的懲罰越大,但泛化能力下降即w增加。這是一個典型的二次凸規(guī)劃問題,因此存在唯一全局最小解。應(yīng)用Lagrange乘子并滿足KKT(Karush-Kuhn-Tucher)條件可得最優(yōu)分類超平面的分類函數(shù)為:
式中:為Lagrange乘子,取值不為零時所對應(yīng)的樣本即為支持向量,b*為分類閾值,sgn(x)為符號函數(shù)。K(xi,x)為支持向量xi和未知向量x的核函數(shù),可通過非線性映射將在低維特征空間中的樣本映射到高維特征空間中去,可以避免在高維特征空間的復(fù)雜運算以及維數(shù)災(zāi)難問題,常用的核函數(shù)有多項式核函數(shù)、高斯核函數(shù)(RBF)、拉普拉斯核函數(shù)、雙曲正割核函數(shù)等。
1.2.2 提取圖像特征 采用支持向量機進行目標點的分類的關(guān)鍵點在于圖像特征的選取[5]。選取CT圖像的圖像特征大致可分為兩組:灰度特征,采用一階統(tǒng)計量化區(qū)域內(nèi)灰度的特性,從灰度直方圖計算而得;紋理特征,通過量化區(qū)域內(nèi)灰度共生矩陣的異質(zhì)差異。見表1。
1.2.3 隨機游走圖像分割方法原理 隨機游走算法是Grady等[6]在2006年提出的一種基于圖論的半自動圖像分割方法。算法首先將CT圖像看做由一定數(shù)量的節(jié)點和邊構(gòu)成的加權(quán)圖,G=(V,E,W)。其中,每一個節(jié)點vi∈V對應(yīng)圖像中的每個像素;每條邊ei,j∈E表示相鄰節(jié)點之間的關(guān)系;每條邊上被賦予一個權(quán)值wi,j∈W,表示種子點通過隨機游走經(jīng)過這條邊的概率,依據(jù)最大概率準則完成圖像分割。
在基于圖論結(jié)構(gòu)的圖像分割算法中,需要給定一個加權(quán)函數(shù),根據(jù)圖像的結(jié)構(gòu)信息、灰度、顏色或紋理信息來表示像素點與像素點之間的權(quán)重大小。加權(quán)函數(shù)有很多定義形式,通常采用高斯權(quán)重函數(shù)來定義加權(quán)函數(shù):
式中:Ii-Ij表示相鄰結(jié)點vi和vj間灰度差。β>0為尺度因子,是該算法中唯一的自由參數(shù)。wi,j表示像素點與像素點之間的權(quán)重大小,直接影響分割效果。
在映射圖中定義聯(lián)合拉普拉斯矩陣,如下式:
其中,di稱為節(jié)點vi的度,定義為與節(jié)點vi所有相鄰邊ei,j上權(quán)值的和。在已經(jīng)固定標記點的值的前提下,通過Dirichlet積分公式求解非種子點到種子點的概率值,如下式:
表1 支持向量機的圖像特征Tab 1 Image features of support vector machines
將映射圖G的所有節(jié)點分為兩類,種子點集合VM和非種子點集合VU,根據(jù)節(jié)點屬于不同集合,將拉普拉斯矩陣分解,將上式改寫成如下形式:
其中,x_U即為所要求解的隨機游走概率,通過求解Dirichlet邊界條件計算所有未標記點到各類標記點的概率值x_U:
LUxU=-BTxM
假設(shè)目標種子點標記為s=1,非目標種子點標記為s=2,各個非種子點vi到達種子點的概率值記為xsi,從而得到數(shù)組M,其對應(yīng)的元素值為:
因此,可以通過下式計算得到所有非種子點到各類種子點概率值:
解得,且根據(jù)值將非種子點vi歸并到概率最大值所屬的類別中,從而實現(xiàn)圖像分割。
1.2.4 SVM與隨機游走相結(jié)合的方法 本文所提出的支持向量機與隨機游走相結(jié)合方法框圖如圖1所示。
圖1 本文方法框圖Fig 1 Block diagram of the method
首先對部分GGO型肺結(jié)節(jié)利用工作站進行手動分割,從已分割的肺結(jié)節(jié)圖像中選取一定數(shù)量的肺結(jié)節(jié)與肺組織的像素點。通過提取像素點及鄰域像素點的圖像特征訓(xùn)練支持向量機。經(jīng)過訓(xùn)練后的支持向量機分類器對肺結(jié)節(jié)和肺組織區(qū)域具有良好的區(qū)分能力。選取待分割的GGO型肺結(jié)節(jié)圖像,在圖像中選取每隔N行N列的像素點以及鄰域像素點,由訓(xùn)練后的支持向量機模型來判斷所選取的像素點是否屬于種子點。隨機游走從支持向量機判斷的種子點開始,通過計算非種子點與種子點之間的概率進行圖像分割。
本實驗使用了50個待分割的GGO型肺結(jié)節(jié)訓(xùn)練支持向量機,使用了150個待分割的GGO型肺結(jié)節(jié)測試算法的分割性能。見圖2。
實驗環(huán)境為E5620 2.40 GHz CPU,8 GB內(nèi)存的PC機上應(yīng)用Matlab 2010a軟件編程實現(xiàn)。本文方法選用RBF函數(shù)作為SVM核函數(shù),參數(shù)選擇為γ=1,C=1。
對每幅圖像由具有5年臨床經(jīng)驗的影像診斷醫(yī)師進行手動分割作為金標準,然后利用本文算法以及3種經(jīng)典分割算法進行分割,最后采用基于像素的3種評價指標,包括準確率(P)、召回率(R)以及F1值,來評價算法的分割性能,如下式:
其中,Area_real是具有5年臨床經(jīng)驗的影像診斷醫(yī)師手動分割出的肺結(jié)節(jié)區(qū)域,作為金標準,Area是利用分割算法得到的肺結(jié)節(jié)區(qū)域。當(dāng)參數(shù)α2=1時,就是最常見的評價指標,稱為F1值,綜合了準確率和召回率的結(jié)果。當(dāng)F1較高時,說明分割方法比較理想,如下式:
圖2 GGO型肺結(jié)節(jié)圖像分割結(jié)果Fig 2 Segmentation results of GGO pulmonary nodules
根據(jù)上式計算出分割結(jié)果的平均準確率、平均召回率以及平均F1值見表2。表2中可以看出:4種分割方法的平均F1值均在85%以上,由于GGO型肺結(jié)節(jié)與肺組織的灰度差別較低,區(qū)域增長會存在很多錯分的區(qū)域,因此其平均F1值最低。本分割方法平均F1值高達96.49%,且平均準確率及平均召回率均在95%以上,說明該算法針對GGO型肺結(jié)節(jié)具有很好的分割性能。
表2 各分割方法分割性能比較Tab 2 Comparison of segmentation performance among different segmentation methods
目前國內(nèi)外一些研究已經(jīng)基于區(qū)域生長、聚類以及活動輪廓模型等分割算法實現(xiàn)了對實性肺結(jié)節(jié)分割的研究[7-9]。然而與較實性的肺結(jié)節(jié)相比,GGO型肺結(jié)節(jié)灰度的范圍較大,且形狀邊界也不規(guī)整;同時GGO型肺結(jié)節(jié)與肺組織的對比較小而顯得模糊,以上造成了計算機對GGO型肺結(jié)節(jié)識別和分割的困難。Son等[10]提出了一種基于三維空間的區(qū)域生長法對GGO型肺結(jié)節(jié)進行分割。Zhou等[11]建立了K近鄰法分類模型得到GGO型肺結(jié)節(jié)的分割結(jié)果。Zhang等[12]采用馬爾科夫隨機場模型的分割算法來分割GGO型肺結(jié)節(jié)。本文采用了基于SVM與隨機游走相結(jié)合的分割算法對GGO型肺結(jié)節(jié)進行自動分割,通過已分割的GGO型肺結(jié)節(jié)區(qū)域訓(xùn)練支持向量機用于選取種子點,利用隨機游走根據(jù)所選取的種子點進行待分割的GGO型肺結(jié)節(jié)的分割,有效地結(jié)合了SVM和隨機游走分割方法的優(yōu)點。與傳統(tǒng)方法相比,該方法具有自動分割能力,且能夠精確地分割出肺結(jié)節(jié)區(qū)域,很好地實現(xiàn)了肺結(jié)節(jié)區(qū)域與周圍肺組織的分離,為GGO型肺結(jié)節(jié)CAD的準確定位提供了必要的條件。該方法簡單高效,準確率高,在醫(yī)學(xué)影像圖像分割領(lǐng)域具有良好的應(yīng)用前景。
[1]Siegel R L,Miller K D,Jemal A.Cancer statistics,2016[J].CA Cancer J Clin,2016,66(1):7
[2]韋春暉.肺癌早期診斷進展[J].臨床肺科雜志,2010,15(8):1136
[3]Cortes C,VapnikV.Support-Vector networks[J].Mach Learn,1995,20(3):273
[4]Fasshauer G E,Hickernell F J,Ye Q.Solving support vector machines in reproducing kernel Banach spaces with positive definite functions[J].Appl Comput Harmon Anal,2015,38(1):115
[5]Gillies R J,Kinahan P E,Hricak H.Radiomics.Images are more than pictures,they are data[J].Radiology,2016,278(2):563
[6]Grady L.Random walks for image segmentation[J].IEEE Trans Pattern Anal Mach Intell,2006,28(11):1768
[7]DehmeshkiJ,AminH,Valdivieso M,et al.Segmentation of pulmonary nodules in thoracic CT scans:a region growing approach[J].IEEE Trans Med Imaging,2008,27(4):467
[8]劉慧,張彩明,鄧凱,等.改進局部自適應(yīng)的快速FCM肺結(jié)節(jié)分割方法[J].計算機輔助設(shè)計與圖形學(xué)學(xué)報,2014,26(10):1727
[9]Way T W,Hadjiiski L M,Sahiner B,et al.Computer-aided diagnosis of pulmonary nodules on CT scans:Segmentation and classification using 3D active contours[J].Med Phys,2006,33(7):2323
[10]Son W,Park S J,P ark C M,et al.Automated volumetric segmentation method for computerized-diagnosis of pure nodular groundglass opacity in high-resolution CT[C].Proc.SPIE 7624,Medical Imaging 2010:Computer-Aided Diagnosis,76241P
[11]Zhou J,Chang S,Metaxas D N,et al.An automatic method for ground glass opacity nodule detection and segmentation from CT studies[J].ConfProc IEEE Eng Med BiolSoc,2006,1:3062
[12]Zhang L,Fang M,Novak C L,et al.Consistent interactive segmentation of pulmonary ground glass nodules identified in CT studies[C].Proceedings of SPIE,2004,5370:1709