陳美玲 張 敬 張玉東 侯 瑩 宋 陽 謝海濱 楊 光
前列腺癌(prostate cancer,PCa)是一種常見的男性疾病[1],多參數(shù)磁共振成像(multi-parametric magnetic resonance imaging,mp-MRI)是一種常用的無創(chuàng)前列腺癌檢查手段。目前臨床醫(yī)生通過磁共振圖像對前列腺癌進(jìn)行診斷,主要依據(jù)歐洲泌尿生殖放射協(xié)會提出的前列腺成像報告和診斷系統(tǒng)(prostate imaging-reporting and diagnosis system,PIRADS)[2]。該診斷方法需要臨床醫(yī)生具有豐富的臨床經(jīng)驗,診斷結(jié)論受醫(yī)生主觀判斷影響較大。
影像組學(xué)(radiomics)近年來備受關(guān)注,它可以通過從醫(yī)學(xué)影像中提取大量定量特征,為疾病診斷選擇穩(wěn)定的、臨床相關(guān)的影像組學(xué)生物標(biāo)志物。目前大量研究表明影像組學(xué)在腫瘤定量診斷方面具有巨大潛力[3]。在前列腺癌診斷方面,多參數(shù)磁共振成像可以從多個序列中提取特征和信息,從多個維度對前列腺癌進(jìn)行診斷[4]。
本研究基于多參數(shù)磁共振圖像,探究了不同序列和不同類型的特征在影像組學(xué)模型中,對臨床顯著性前列腺癌(clinically significant PCa,CS-PCa)和非顯著性前列腺癌(non-clinically significant PCa,Non-CS-PCa)診斷效能的影響。通過訓(xùn)練集和獨立的測試集,使用不同特征分別建立模型進(jìn)行比較,選出了進(jìn)行顯著性前列腺癌診斷的最佳組合。
本文將從數(shù)據(jù)集描述、特征提取、模型建立、模型評估四個步驟進(jìn)行闡述,流程圖見圖1。
圖1 建模流程圖。
本研究使用PROSTATEx 數(shù)據(jù)集(https://doi.org/10.7937/K9TCIA.2017.MURS5CL)作為研究對象。該數(shù)據(jù)集中包括T2 加權(quán)圖像、質(zhì)子密度加權(quán)圖像(proton density weighted,PDW)、動態(tài)對比度增強圖像(dynamic contrast enhanced, DCE)和彌散加權(quán)圖像(diffusion-weighted imaging,DWI),所有圖像都是在西門子3T 磁共振設(shè)備上掃描得到。本研究根據(jù)PI-RADS 指南和相關(guān)研究[5-6],選擇高b 值DWI 圖像(b=800s/mm2)、表觀擴散系數(shù)圖像(apparent diffusion coefficient,ADC)和T2加權(quán)圖像來進(jìn)行建模。其中,T2 加權(quán)圖像是通過自旋回波序列獲得的橫斷位圖像,該序列層內(nèi)分辨率為0.5mm×0.5mm,層厚為3.6mm。DWI 序列的層內(nèi)分辨率為2mm×2mm,層厚為3.6mm,b 值為800s/mm2。ADC 圖像通過對DWI 進(jìn)行計算得到。DWI 序列和ADC 圖像配準(zhǔn)至T2 圖像上。
本研究選取圖像分辨率一致的252例數(shù)據(jù)(共252個 癌 灶,CS-PCa:Non-CS-PCa=68:184),其 中 訓(xùn) 練 集177例(CS-PCa:Non-CS-PCa=48:129)用于模型訓(xùn)練,剩余75例數(shù)據(jù)(CSPCa:Non-CS-PCa=20:55)用于模型測試。具有超過十年臨床經(jīng)驗的影像科醫(yī)生,根據(jù)PROSTATEx提供的穿刺位置進(jìn)行癌灶區(qū)域(region of interest,ROI)勾畫,以進(jìn)行特征提取。
圖2 是三種序列對應(yīng)的非顯著性前列腺癌和顯著性前列腺癌病例示意圖。其中,第一行對應(yīng)非顯著性癌,第二行對應(yīng)顯著性癌,從左至右分別為ADC,DWI,T2 加權(quán)圖像。
首先,本研究對三種序列圖像分別使用Pyradiomics( 版 本 號:2.2.1,https://pyradiomics.readthedocs.io/en/latest/)進(jìn)行特征提取,提取的特征種類包括灰度特征和紋理特征,其中灰度特征有18個,紋理特征又包含灰度共生矩陣24個、灰度區(qū)域大小矩陣16個、灰度游程矩陣16個、 鄰域灰度差異矩陣5個和灰度相關(guān)矩陣14個。
針對特征矩陣中的樣本不均衡問題,本研究使用合成少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique,SMOTE)對訓(xùn)練集中的顯著性前列腺癌進(jìn)行過采樣操作。針對不同序列,對T2 加權(quán)圖像、DWI 和ADC 的特征矩陣分別建模,再將三個序列的特征組合后進(jìn)行建模分析。
首先對特征矩陣進(jìn)行歸一化操作,每個特征向量減去均值并除以標(biāo)準(zhǔn)差,以消除不同特征之間的數(shù)量級差異。然后用皮爾遜相關(guān)系數(shù)(pearson correlation coefficient,PCC)對特征進(jìn)行約束,當(dāng)任意兩個特征向量之間的PCC >0.9 時,即認(rèn)為這兩個特征相似度很高,隨機去掉一個,以減少信息冗余并減小建模時發(fā)生過擬合的可能。接下來,使用方差分析(analysis of variance,ANOVA)對特征進(jìn)行排序,特征數(shù)目用單位標(biāo)準(zhǔn)差(onestandard error,OSE)方法確定,建模方法選用邏輯回歸(logistic regression)。本研究使用了五折法在訓(xùn)練集上進(jìn)行交叉驗證,得到最終模型后在獨立測試集上進(jìn)行模型評價。上述實驗過程均在實驗室自行開發(fā)的開源軟 件FeAture Explorer(FAE v 0.2.5,https://github.com/salan668/FAE)的環(huán)境中完成。
表1 不同序列灰度特征的建模結(jié)果
表2 不同序列紋理特征的建模結(jié)果
表3 不同序列使用灰度特征和紋理特征混合建模結(jié)果
本研究對不同序列的圖像組合及不同類型的特征組合進(jìn)行建模比較,使用測試集的接收者操作特性曲線(receiver operating characteristic curve,ROC)和對應(yīng)曲線下面積(area under the curve,AUC)進(jìn)行模型評估。同時我們還計算了模型在測試集上的敏感性和特異性,統(tǒng)計方法采用Wilcoxan秩和檢驗,顯著性差異取0.05。
圖2 非顯著性癌(第一行)和顯著性癌(第二行)示意圖。其中從左至右分別為ADC、DWI 和T2 加權(quán)圖像。
我們首先只使用灰度特征進(jìn)行建模。本研究發(fā)現(xiàn)當(dāng)只使用ADC 或高b 值DWI 的灰度特征進(jìn)行建模時,ADC 和高b 值DWI 的灰度特征模型在測試集上AUC 均達(dá)到0.76,而T2 加權(quán)圖像的灰度特征模型在測試集上AUC只有0.59(P<0.05)。當(dāng)三個序列的灰度特征混合后進(jìn)行建模時,模型在測試集上的AUC 可以達(dá)到0.85,此時的敏感性和特異性分別為0.75 和0.87,顯著高于3個序列獨自的建模效果(P<0.05),結(jié)果如表1 所示。
我們只使用紋理特征進(jìn)行建模的結(jié)果如表2 所示。從表中可見,T2 加權(quán)圖像的紋理特征對于區(qū)分顯著性癌和非顯著性癌的效果有限,測試集AUC 僅達(dá)到0.57,敏感性為0.80,特異性為0.47。使用ADC、高b 值DWI 的紋理特征進(jìn)行建模時,測試集的AUC 分別達(dá)到0.70 和0.73,敏感性分別為0.90和0.70,特異性分別為0.55 和0.76,顯著高于T2加權(quán)圖像的紋理特征模型(P<0.05)。我們將3個序列的紋理特征混合建模,測試集AUC 達(dá)到0.85,敏感性和特異性分別為0.80 和0.82,好于3個序列單一建模的表現(xiàn)(P<0.05)。
我們將灰度特征和紋理特征進(jìn)行混合,不同序列的建模效果如表3 所示。本研究發(fā)現(xiàn),灰度特征和紋理特征混合后,T2 加權(quán)系列的模型表現(xiàn)比僅用灰度特征或僅用紋理特征建模的測試集AUC 有所提高,達(dá)到0.61(P<0.05);ADC 和高b 值DWI系列的模型在測試集上的AUC 分別達(dá)到0.87 和0.85,敏感性達(dá)到0.90 和0.75,特異性達(dá)到0.71 和0.87。高于只使用灰度特征或紋理特征的建模結(jié)果(P<0.05);將多個序列的灰度和紋理特征進(jìn)行混合,測試集AUC 達(dá)到0.82,敏感性達(dá)到0.80,特異性達(dá)到0.78,略低于只使用用紋理特征建模的混合模型(P<0.05)。圖 3 展示了所有模型的表現(xiàn)。
本文研究了影像組學(xué)模型在多參數(shù)磁共振成像診斷CS-PCa 的效能,探究了不同序列組合和不同特征組合對影像組學(xué)模型診斷效能的影響。發(fā)現(xiàn)彌散序列的特征在區(qū)分前列腺癌的臨床顯著性上,比T2加權(quán)圖像更能發(fā)揮作用。同時使用灰度特征和紋理特征的組合建模時,能夠提升模型的表現(xiàn)能力。T2 加權(quán)圖像具有較高的組織分辨率,但前列腺外周帶通常在T2 加權(quán)圖像表現(xiàn)出高信號,非顯著性前列腺癌可能與高信號外周帶等強度,因此在前列腺癌的臨床顯著性的判斷上,T2 加權(quán)圖像無法提供有效信息[8]。而彌散圖像序列由于突出水分子的擴散性,特別是在高b 值DWI 圖像上,能夠?qū)Π┰畹呐R床顯著性和非顯著性進(jìn)行區(qū)別[9]。ADC 圖像是通過DWI 序列計算得到,能夠定量反映水分子的擴散性質(zhì),也能達(dá)到較好的分類效果。因此,高b 值DWI 和ADC 圖像單獨建模,能夠得到比T2 加權(quán)圖像更好的建模效果。
圖3 不同類型特征和不同序列建模效果比較。
多種序列特征混合,得到的AUC 均能高于0.80,但同時使用灰度特征和紋理特征時,混合模型的AUC 略有下降,其原因可能是特征矩陣包含了多種序列的灰度特征和紋理特征,特征空間維度過高,在數(shù)據(jù)降維和特征選擇過程中,篩選出的特征由于隨機因素?zé)o法找到最優(yōu)解。本研究通過預(yù)先篩選不同的輸入序列和特征種類,降低了建模的解空間復(fù)雜度,增加得到最優(yōu)模型的概率。
本研究有如下局限:①對于機器學(xué)習(xí)來說,本研究進(jìn)行模型訓(xùn)練時使用的樣本數(shù)量十分有限,本研究使用的是單中心的數(shù)據(jù),為了更好地驗證我們的模型,還需要進(jìn)一步使用多中心數(shù)據(jù)進(jìn)行驗證;②模型的建立僅僅使用了部分影像信息,還未包含其他影像的信息和臨床信息;③本研究所使用的公開數(shù)據(jù)集中已經(jīng)提供前列腺癌的分割結(jié)果,在前列腺癌分級的實際應(yīng)用中,或需要對癌灶進(jìn)行分割,或需要根據(jù)計劃的穿刺點確定周邊區(qū)域,然后進(jìn)行特征提取。
本研究通過比較不同序列和不同類型特征,探索了多參數(shù)磁共振成像的影像組學(xué)模型對于臨床顯著性前列腺癌的診斷情況,本研究發(fā)現(xiàn)彌散圖像序列的灰度特征和紋理特征能夠建立較好的診斷模型,在臨床中為臨床顯著性前列腺癌的診斷提供幫助?;谏疃葘W(xué)習(xí)算法進(jìn)行多參數(shù)磁共振圖像的癌灶識別和癌灶分割,將是我們接下來的研究方向。