吳翠穎,周濤,陸惠玲,姚中寶,王媛媛,楊鵬飛
(1.寧夏醫(yī)科大學(xué)公共衛(wèi)生和管理學(xué)院,銀川750004;2.寧夏醫(yī)科大學(xué)理學(xué)院,銀川750004;3.寧夏醫(yī)科大學(xué)總醫(yī)院核醫(yī)學(xué)科,銀川750004)
肺癌是世界上發(fā)病率和死亡率增長最快,對人類健康構(gòu)成巨大威脅的惡性腫瘤之一[1]。在肺部腫瘤診斷中,臨床醫(yī)師通常首先選擇CT檢查發(fā)現(xiàn)病變,其可以為肺癌患者的診斷提供精確而詳細(xì)的解剖信息,然而CT檢查只能在解剖和形態(tài)上顯示病變的特征性變化[2];PET圖像能夠提供癌細(xì)胞的代謝和功能信息,能從分子水平上反映人體的生理、代謝狀況等[3],但其空間分辨率差,定位不準(zhǔn)確;PET/CT是一種集PET的功能顯像和CT解剖形態(tài)影像于一體的新型影像設(shè)備,可以同時反映肺癌患者病灶的生理功能變化及形態(tài)結(jié)構(gòu)變化[4]。目前對肺部腫瘤的輔助診斷大部分都是采用個體分類器的應(yīng)用,而集成分類技術(shù)使用的較少,因此,本研究提出基于集成SVM的肺部腫瘤PET/CT計算機輔助診斷新方法。以肺部腫瘤為研究對象,首先提取了CT、PET、PET/CT影像中肺部腫瘤的紋理、形狀、灰度統(tǒng)計特征;其次描述了基于集成SVM的肺部腫瘤識別算法;最后進(jìn)行仿真實驗,給出并比較不同模態(tài)、不同特征之間單支持向量機和集成SVM的實驗結(jié)果。
從寧夏醫(yī)科大學(xué)附屬醫(yī)院核醫(yī)學(xué)科收集經(jīng)過影像科醫(yī)生標(biāo)記的2000例肺部腫瘤患者(1000例良性,1000例惡性)選擇同一病灶的三模態(tài)(CT、PET、PET/CT)圖像作為研究樣本,分別在三模態(tài)中提取不同的特征,然后在3個不同的樣本空間構(gòu)成的3類特征空間里構(gòu)造個體SVM,再通過相對多數(shù)投票進(jìn)行集成,實現(xiàn)對肺部腫瘤的分類識別。集成SVM肺部腫瘤識別方法見圖1。
圖1 基于集成SVM的肺部腫瘤PET/CT三模態(tài)計算機輔助診斷流程圖Fig 1 SVM ensemble based Com puter-aided-diagnosismethod of lung tumor using PET/CT multi-modality data
CT屬于解剖結(jié)構(gòu)類圖像,擁有較高的空間分辨率,能夠精確定位病灶部位,但無法反映組織和器官的功能信息[5]。由于肺部CT圖像是灰度圖像,肺部各區(qū)域間的灰度差異能夠突顯不同組織和結(jié)構(gòu)[6],所以,提取灰度特征能夠有效地反映圖像的灰度信息。CT圖像進(jìn)行預(yù)處理后,肺部圖像的形狀特征比較直觀,我們可以對其進(jìn)行幾何特征的測量和分析,通過提取目標(biāo)圖像的形狀特征能夠較好的識別目標(biāo)圖像。另外,CT圖像含有不規(guī)則性局部區(qū)域和周期性的灰度分布,但整體上表現(xiàn)出某種規(guī)律性,反映物體表面的粗糙度、規(guī)則性和方向性[7],因此,可以通過提取紋理特征并對獲得的紋理進(jìn)行定性或定量的分析,識別目標(biāo)圖像。表1[8]給出了CT特征分量集合。
表1 CT特征集合Table 1 CT features set
PET屬于功能圖像,能夠提供臟器和組織功能的代謝信息,但其空間分辨率差[9]。在PET圖像中,肺部惡性腫瘤ROI區(qū)域是一黑色亮斑,肺部良性腫瘤ROI是白色區(qū)域,難以直接準(zhǔn)確地提取周長、面積、圓形度、矩形度、伸長度和歐拉數(shù)特征,但其具有對圖像描述穩(wěn)定性和不變性的特點[10],因此,通過提取Hu矩特征來描述PET圖像的基本特征。PET圖像是灰度圖像,各區(qū)域之間灰度差異明顯,提供了圖像灰度方向、間隔和變化幅度的信息。因此,灰度特征和紋理特征能夠反映圖像灰度空間變化信息。表2給出了PET特征分量集合。
表2 PET特征集合Table 2 PET features set
PET/CT同時進(jìn)行 PET顯像和 CT顯像,利用CT圖像對PET圖像病變部位進(jìn)行解剖定位和鑒別診斷,解決了圖像解剖結(jié)構(gòu)不清楚的缺陷,但PET顯像是一個亮斑,無法得到比較直觀的形狀特征,所以無法準(zhǔn)確提取周長、面積、圓形度、矩形度、伸長度和歐拉數(shù)特征,由于PET/CT圖像灰度信息變化明顯,具有周期性的灰度分布,故提取以下特征分量識別目標(biāo)圖像。表3給出了PET/CT特征分量集合。
表3 PET/CT特征集合Table 3 PET/CT features set
三個樣本空間PET、CT、PET/CT分別獲得不同的向量子空間,使得樣本空間和特征空間差異度大,符合集成SVM中若干個體分類器差異度越大或輸入樣本之間差異度越大,越能得到較好分類結(jié)果的基本思想。
(1)硬件環(huán)境:Intel Core i54670-3.4 GHz,8.0 GB內(nèi)存,500 GB硬盤,Windows10系統(tǒng)。
(2)軟件環(huán)境:Matlab R2012b,LibSVM。
(3)實驗數(shù)據(jù):采用經(jīng)醫(yī)生標(biāo)記的2000幅肺部腫瘤三模態(tài)圖像作為實驗樣本,三模態(tài)病灶截取后大小均為50×50,其中:
訓(xùn)練樣本:分別在1000例肺部惡性腫瘤和1000例肺部良性腫瘤中各取900幅的特征;
測試樣本:其余200幅特征。
由于篇幅的關(guān)系,各給出4幅CT、PET、PET/CT的肺部惡性腫瘤和肺部良性腫瘤ROI區(qū)域。見圖2。
圖2 三模態(tài)肺部惡性腫瘤和肺部良性腫瘤ROIFig 2 Threemodal lung cancer and lung benign tumor ROI
本研究采用十折交叉驗證法分別計算代表CT、PET、PET/CT圖像識別性能的分類正確率、敏感性、特異性和算法耗時四個指標(biāo),在1800個訓(xùn)練樣本中進(jìn)行訓(xùn)練,在200個測試樣本中進(jìn)行測試,做了以下四組實驗。研究中采用網(wǎng)格尋優(yōu)算法對SVM進(jìn)行優(yōu)化,利用K-CV方法[11],得到訓(xùn)練集驗證分類準(zhǔn)確率最高的C和g作為最佳參數(shù)?;诰W(wǎng)格優(yōu)化后SVM參數(shù)選擇結(jié)果見圖3,表4。
4.2.1 在CT特征空間里構(gòu)造個體分類器 在CT樣本空間提取的80維特征空間里構(gòu)造個體CTSVM分類器,并對樣本子集進(jìn)行訓(xùn)練,其分類識別性能見表5。
圖3 SVM參數(shù)選擇結(jié)果(3D視圖)Fig 3 Parameter selection result(3D view)
表4 SVM參數(shù)選擇結(jié)果Table 4 Parameter selection result
表5 CT圖像特征識別性能統(tǒng)計表(%)Table 5 CT image feature recognition performance statistics(%)
實驗表明,CT圖像特征識別的正確率為95.45%,說明在CT圖像提取的特征空間里構(gòu)成的CT-SVM分類器中特異性低,敏感性低,說明其誤診率或漏診概率較高。
4.2.2 在PET特征空間構(gòu)造個體分類器 在PET樣本空間提取的98維特征空間里構(gòu)造個體PETSVM分類器,并對樣本子集進(jìn)行訓(xùn)練,其分類識別性能見表6。
實驗表明,PET圖像特征識別的正確率為99.7%,由于PET肺部惡性腫瘤ROI區(qū)域為黑色亮斑,而肺部良性腫瘤ROI區(qū)域則為白色,易于計算機區(qū)分,故在PET圖像提取的特征空間里構(gòu)成的PET-SVM分類器中得到的正確率比較高,特異性和敏感性也相對較高,導(dǎo)致誤診或漏診的概率小。其算法耗時相比4.2.1實驗也有縮減,表明PET肺部惡性腫瘤ROI和良性腫瘤ROI對于計算機來說易于識別,從而提高了肺部腫瘤的診斷性能。
表6 PET圖像特征識別性能統(tǒng)計表(%)Table 6 PET image feature recognition performance statistics(%)
4.2.3 在PET/CT特征空間里構(gòu)造個體分類器在PET/CT樣本空間提取的98維特征空間里構(gòu)造個體PET/CT-SVM分類器,并對樣本子集進(jìn)行訓(xùn)練,其分類識別性能見表7。
實驗表明,PET圖像和PET/CT圖像最后得到分類正確率分別為99.7%和97.05%,說明在PET圖像和PET/CT圖像特征提取時,其提取的特征分量能夠比較準(zhǔn)確、全面的描述其ROI。但是,由于PET肺部惡性腫瘤ROI區(qū)域為黑色亮斑,肺部良性腫瘤ROI區(qū)域為白色,而PET/CT圖像是CT圖像和PET圖像的組合體,其良性腫瘤ROI不是只顯示白色,故PET圖像相對于PET/CT圖像更易于計算機區(qū)分,因此PET圖像的分類正確率較高。CT圖像最后得到正確率比PET圖像和PET/CT圖像的正確率低,說明不同的單模態(tài)同時單模態(tài)提取不同特征構(gòu)造的SVM訓(xùn)練樣本子集得到的分類準(zhǔn)確率不一致。因此,為了提高分類準(zhǔn)確率,做了第四組實驗。
表7 PET/CT圖像特征識別性能統(tǒng)計表(%)Table 7 PET/CT image feature recognition performance statistics(%)
4.2.4 基于集成學(xué)習(xí)計算機輔助診斷模型 上述三個實驗結(jié)果表明,不同的單模態(tài)同時單模態(tài)提取不同特征構(gòu)造SVM訓(xùn)練樣本子集最后對腫瘤識別精度的影響程度不一樣。因此,可以通過集成學(xué)習(xí)對個體SVM輸出結(jié)果進(jìn)行相對多數(shù)投票,提高系統(tǒng)的泛化性能。
通過集成學(xué)習(xí)對三個不同模態(tài)分類結(jié)果進(jìn)行投票,見表8,最終得出集成分類正確率為99.85%,相比于4.2.1、4.2.2、4.2.3實驗中的 CT、PET、PET/CT的正確率分別提高了4.4%,0.15%,2.8%。集成后的敏感性和特異性也有所提高,這說明集成學(xué)習(xí)把若干單個分類器的分類結(jié)果進(jìn)行投票來決定最終的分類,明顯提高準(zhǔn)確率,同時也說明三個模態(tài)之間,選擇提取的特征值之間差異度大,精度高。
集成不但能提高分類精度,還能增強分類器的容錯能力。通過以上實驗可知,集成后的識別精度比單個分類器的識別精度沒有太大程度的提高,為此做了以下一組實驗驗證集成的容錯能力。
4.2.5 擾亂CT特征空間10%的數(shù)據(jù)并構(gòu)造個體分類器 在4.2.1實驗的基礎(chǔ)上,擾亂CT特征空間里10%的數(shù)據(jù),即將其中100例良性腫瘤的數(shù)據(jù)標(biāo)為惡性,100例惡性腫瘤的數(shù)據(jù)標(biāo)為良性,然后構(gòu)造個體分類器進(jìn)行訓(xùn)練,其分類識別性能見表9。
從表9可知,擾亂CT特征空間10%的數(shù)據(jù)之后其分類識別精度下降到86.45%,在此基礎(chǔ)上結(jié)合4.2.2和4.2.3實驗,進(jìn)行集成學(xué)習(xí)。結(jié)果見表10。
表8 三模態(tài)集成性能統(tǒng)計表(%)Table 8 Threemodal integration performance statistics(%)
表9 CT圖像特征識別性能統(tǒng)計表(%)Table 9 CT image feature recognition performance statistics(%)
表10 三模態(tài)集成性能統(tǒng)計表(%)Table 10 Threemodal integration performance statistics(%)
實驗表明,擾亂CT特征空間里10%的數(shù)據(jù)后,構(gòu)造個體分類器得到的識別精度是86.45%,相比于4.2.1實驗精度大幅度下降,然而進(jìn)行集成學(xué)習(xí)時,識別精度為98.4%,相對于4.2.4實驗的集成結(jié)果還是比較穩(wěn)定的,因此,集成學(xué)習(xí)能夠增強分類器的容錯能力。
本研究從三模態(tài)圖像出發(fā),提出了一種基于集成SVM的肺部腫瘤PET/CT計算機輔助診斷新方法。該方法針對不同模態(tài)分別提取不同特征,然后在3個不同樣本空間構(gòu)成的3類不同特征空間里構(gòu)造個體SVM,通過相對多數(shù)投票進(jìn)行集成得出最終的分類結(jié)果。實驗結(jié)果表明本方法能夠有效提高肺部腫瘤的識別精度,對肺部腫瘤診斷的特異性和敏感性明顯優(yōu)于單一分類器識別,同時集成學(xué)習(xí)能夠增強分類器的容錯能力,為肺部腫瘤的輔助診斷提供技術(shù)支持。