徐文杰 鄧水堂 安永玉 王健 敖煒群 謝宗玉 楊昭 王小雷 茅國群
數(shù)字乳腺X線攝影(mammography,MG)是當(dāng)前乳腺癌診斷和篩查的首選檢查方法之一。MG圖像顯示鈣化為乳腺癌最重要的特征之一,但非典型鈣化判斷腫瘤良、惡性較困難。根據(jù)乳腺影像報告與數(shù)據(jù)系統(tǒng)(breast imaging reporting and data system,BI-RADS)標(biāo)準(zhǔn),對于診斷為BI-RADS 4類的鈣化病灶需要活檢以明確惡性風(fēng)險[1],但此類鈣化惡性概率范圍甚大,為2%~95%,而文獻報道陽性預(yù)測值僅為32.9%~34.0%[2-3]。另外部分鈣化由于影像學(xué)上有較多重疊,判定BI-RADS 4C或5類較難。當(dāng)前,影像組學(xué)已廣泛用于臨床研究,列線圖是近年來在影像組學(xué)研究中推薦使用的一種形象、直觀的風(fēng)險評估模型方法,在乳腺MG檢查中的研究已有開展[4-5],但對于BI-RADS 4~5類鈣化的深入研究較少。本研究旨在探討基于乳腺MG檢查的影像組學(xué)列線圖在預(yù)測鈣化惡性風(fēng)險中的價值,現(xiàn)將結(jié)果報道如下。
1.1 對象 回顧2017年1月至2020年12月浙江省立同德醫(yī)院49例和蚌埠醫(yī)學(xué)院第一附屬醫(yī)院262例女性患者MG檢查圖像及病歷資料,MG檢查均診斷為BI-RADS 4~5類的可疑惡性鈣化。納入標(biāo)準(zhǔn):(1)MG圖像顯示有明確鈣化灶,周圍無明確腫塊;(2)患者MG檢查后1個月內(nèi)完成穿刺活檢或手術(shù)治療,有完整手術(shù)病理資料;(3)圖像質(zhì)量清晰,滿足鈣化分析。排除標(biāo)準(zhǔn):(1)無完整手術(shù)病理資料及長期影像隨訪結(jié)果者;(2)術(shù)前曾行化療、放療患者;(3)MG圖像質(zhì)量差,影響鈣化判斷者;(4)2個及以上手術(shù)病灶。排除術(shù)前放化療4例及2個及以上手術(shù)病灶患者15例,最終納入292 例,年齡22~77(47.28±9.93)歲,其中惡性171例(浸潤性癌89例,導(dǎo)管內(nèi)癌79例,髓樣癌1例,化生癌1例,黏液腺癌1例),良性121例(纖維腺瘤33例,腺病77例,乳頭狀瘤4例,其他良性病灶7例)。采用Python隨機分類函數(shù)按照7∶3比例分為訓(xùn)練集204例和驗證集88例。本研究經(jīng)浙江省立同德醫(yī)院和蚌埠醫(yī)學(xué)院第一附屬醫(yī)院醫(yī)學(xué)倫理委員會批準(zhǔn)。
1.2 方法 采用美國Hologic Selenia(Hologic Medical Systems,Boston)全數(shù)字化乳腺X線機(浙江省立同德醫(yī)院)和德國Siemens Mammomat Inspiration數(shù)字化乳腺X線機(蚌埠醫(yī)學(xué)院第一附屬醫(yī)院)。拍攝部位包括雙側(cè)乳腺頭尾位(craniocaudal,CC)和內(nèi)外斜位(mediolateral oblique,MLO)。拍攝時均采用自動曝光系統(tǒng)。
1.3 圖像評估 由2位4年以上乳腺亞專業(yè)的放射診斷醫(yī)師(1位主治醫(yī)師,1位主任醫(yī)師)在對病理檢查結(jié)果不知情的情況下按照美國放射學(xué)院(American College of Radiology,ACR)第5版BI-RADS標(biāo)準(zhǔn)評估以下影像指標(biāo)并記錄:(1)乳腺密度分型分為脂肪型、散在纖維腺體型、不均勻致密型及極其致密型,前兩型歸為非致密型,后兩型歸為致密型;(2)鈣化形態(tài)分為無定形、細小多形性、粗糙不均質(zhì)、細線狀或細分支狀;(3)鈣化分布分為簇狀、段樣、線樣、區(qū)域性及彌漫性;(4)BI-RADS分類依據(jù)鈣化特征綜合評估。當(dāng)2位醫(yī)師意見不一致時由第3位乳腺專業(yè)的主任醫(yī)師進行評估,且為最終評估結(jié)果。
1.4 影像組學(xué)特征提取及篩選 同樣由以上2位診斷醫(yī)師利用ITK-SNAP軟件對乳腺目標(biāo)鈣化灶的CC和MLO圖像進行手動分割,先由1位醫(yī)師勾畫感興趣區(qū)域(region of interest,ROI),然后由另1位醫(yī)師對所勾畫ROI進行審核,意見不統(tǒng)一時共同商討決定勾畫范圍。如患者為彌漫鈣化則選取相對集中且風(fēng)險較高區(qū)域分割。為避免數(shù)據(jù)異質(zhì)性,對所有DICOM圖像進行重采樣歸一化到相同的分辨率(1 mm×1 mm×1 mm)。采用Python中的擴展軟件包pyradiomics進行特征提取。對提取的特征采用Z-score標(biāo)準(zhǔn)化處理將每種特征量綱縮放到相同的數(shù)量級。應(yīng)用R語言(版本3.6.1,http:www.rproject.rog)的最小冗余最大相關(guān)(minimum redundancy maximum relevance,mRMR)軟件對上述特征進行分析。利用訓(xùn)練集里的影像組學(xué)數(shù)據(jù),采用mRMR的多變量方法,在去除冗余和低重現(xiàn)性特征后,基于啟發(fā)式評分標(biāo)準(zhǔn)識別最重要的特征,將排名前30位的特征再用最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)方法進行篩選。
1.5 模型構(gòu)建 影像組學(xué)模型:選取從CC、MLO圖像中篩選的特征,運用logistic回歸計算影像組學(xué)評分并建立影像組學(xué)模型(單一CC模型、單一MLO模型和CC+MLO模型);臨床模型:比較良、惡性組患者的年齡、絕經(jīng)狀態(tài)、鈣化形態(tài)、鈣化分布、BI-RADS分類的差異,通過單因素及多因素logistic回歸分析篩選出差異有統(tǒng)計學(xué)意義的獨立危險因素,建立臨床診斷模型;聯(lián)合模型:采用多因素logistic回歸分析,聯(lián)合篩選出的臨床獨立危險因素和影像組學(xué)評分建立聯(lián)合模型。最后基于聯(lián)合模型構(gòu)建列線圖。
1.6 統(tǒng)計學(xué)處理 采用SPSS 22.0統(tǒng)計軟件。計量資料以表示,組間比較采用兩獨立樣本t檢驗;計數(shù)資料以例(%)表示,組間比較采用χ2檢驗。采用ROC曲線評估各模型的診斷效能,計算AUC、靈敏度、特異度和準(zhǔn)確度。采用校準(zhǔn)曲線及決策曲線評估列線圖在預(yù)測乳腺鈣化惡性風(fēng)險中的一致性和臨床價值。P<0.05為差異有統(tǒng)計學(xué)意義。
2.1 良、惡性患者臨床特征的比較 良性組和惡性組患者年齡、絕經(jīng)狀態(tài)、鈣化形態(tài)、鈣化分布、BI-RADS分類方面比較差異均有統(tǒng)計學(xué)意義(均P<0.01),但乳腺密度比較差異無統(tǒng)計學(xué)意義(P>0.05)。訓(xùn)練集和驗證集在年齡、絕經(jīng)狀態(tài)、乳腺密度及鈣化分布方面比較差異均無統(tǒng)計學(xué)意義(均P>0.05),但在鈣化形態(tài)、BI-RADS分類方面比較差異均有統(tǒng)計學(xué)意義(均P<0.05)。訓(xùn)練集和驗證集中鈣化的惡性率分別為60.3%(123/204)、47.7%(42/88),差異無統(tǒng)計學(xué)意義(P>0.05)。見表1。
表1 良、惡性患者臨床特征的比較
2.2 乳腺鈣化惡性的危險因素分析 經(jīng)單因素logistic回歸分析顯示,年齡、絕經(jīng)狀態(tài)、鈣化形態(tài)、鈣化分布和BI-RADS分類是預(yù)測乳腺鈣化惡性風(fēng)險的危險因素;多因素logistic回歸分析顯示,年齡(OR=1.075,95%CI:1.028~1.125,P<0.01)、BI-RADS 分類(OR=4.924,95%CI:2.818~8.605,P<0.01)是預(yù)測乳腺鈣化惡性風(fēng)險的獨立危險因素。見表2。
表2 良、惡性組臨床特征單因素和多因素logistic回歸分析
2.3 影像組學(xué)特征 本研究中從CC及MLO圖像中均提取到851個高維特征,包括14個形狀特征、18個一階特征、75個紋理特征和744個小波特征。特征經(jīng)Z-score標(biāo)準(zhǔn)化處理后采用mRMR及LASSO回歸模型篩選出與鈣化惡性風(fēng)險相關(guān)的組學(xué)特征,CC圖像的組學(xué)特征有4個(4個小波特征),為wavelet.LLH_glcm_Imc2、wavelet.LLH_glrlm_LongRunHighGrayLevelEmphasis、wavelet.HHH_gldm_LargeDependenceHighGrayLevelEmphasis、wavelet.LLL_glcm_JointAverage,MLO 圖像的組學(xué)特征有6個(2個一階特征和4個小波特征),為wavelet.LLL_glszm_LargeAreaLowGrayLevelEmphasis、original_firstorder_InterquartileRange、wavelet.LLH_glrlm_Long-RunHighGrayLevelEmphasis、original_glszm_LargeAreaL-owGrayLevelEmphasis、wavelet.LLL_ngtdm_Strength、origin-al_glszm_LowGrayLevelZoneEmphasis。
2.4 3種模型預(yù)測鈣化惡性風(fēng)險效能比較 臨床模型由兩項獨立危險因素即患者年齡、BI-RADS分類構(gòu)建而成。驗證集中CC+MLO模型預(yù)測鈣化惡性風(fēng)險的效能均高于單一CC模型和單一MLO模型,其AUC分別為0.714、0.697、0.708,在后續(xù)的模型效能比較中均采用CC+MLO模型作為影像組學(xué)模型。ROC曲線分析顯示,在驗證集中,與影像組學(xué)模型和臨床模型相比,聯(lián)合模型具有更高的效能。在訓(xùn)練集中,聯(lián)合模型預(yù)測鈣化惡性風(fēng)險的靈敏度、特異度、準(zhǔn)確度分別為 0.705、0.878、0.775;在 驗 證 集 中 分 別 為 0.708、0.900、0.795。在驗證集中,與臨床模型和影像組學(xué)模型相比,聯(lián)合模型具有最高的特異度、準(zhǔn)確度。見表3和圖1。
圖1 3種模型預(yù)測鈣化惡性風(fēng)險的ROC曲線(A:訓(xùn)練集;B:驗證集)
表3 3種模型預(yù)測鈣化惡性風(fēng)險效能比較
2.5 列線圖構(gòu)建 基于聯(lián)合模型,構(gòu)建可視化的臨床-影像組學(xué)列線圖,以個性化評估鈣化惡性風(fēng)險,見圖2。在該列線圖中,與年齡相比,BI-RADS分類和影像組學(xué)評分占據(jù)了評分標(biāo)度的較大部分,表明BIRADS分類和圖像影像組學(xué)特征參數(shù)在預(yù)測鈣化惡性風(fēng)險中起主導(dǎo)作用。圖3為校準(zhǔn)曲線,表示列線圖預(yù)測的惡性風(fēng)險值和實際病理之間具有良好一致性。圖4為決策曲線,顯示臨床-影像組學(xué)列線圖在預(yù)測乳腺鈣化惡性風(fēng)險方面具有較高的凈獲益。
圖2 基于聯(lián)合模型構(gòu)建的預(yù)測鈣化惡性風(fēng)險的列線圖
圖3 影像組學(xué)諾謨圖預(yù)測鈣化惡性風(fēng)險的校準(zhǔn)曲線
圖4 3種模型的決策曲線圖
根據(jù)ACR BI-RADS標(biāo)準(zhǔn),BI-RADS 4類鈣化需要活檢,5類需要手術(shù)。但4類鈣化惡性風(fēng)險為2%~95%,跨度甚大,有部分患者實施了不必要的活檢。另外,在臨床實際工作中,BI-RADS 4C和5類較難把握。以往一些研究顯示機器學(xué)習(xí)的方法可以為鈣化病灶的診斷提供支持,包括影像組學(xué)[6]。本研究從292例患者的CC和MLO圖像中各提取851個特征,通過mRMR及LASSO回歸篩選出4個及6個最有價值的影像組學(xué)特征構(gòu)建組學(xué)模型,共創(chuàng)建3個影像組學(xué)模型,分別是單一CC和單一MLO模型以及CC+MLO模型,結(jié)果顯示驗證集中CC+MLO模型預(yù)測鈣化惡性風(fēng)險的效能均高于前兩者,其AUC為0.714。這與彭程宇等[7]和 Lei等[8]研究結(jié)果相仿。
以往研究表明,乳腺癌的發(fā)生除了與病灶本身的特征相關(guān)外還與多項臨床因素有關(guān)[9]。本研究對照病理檢查結(jié)果發(fā)現(xiàn)良性組和惡性組在年齡、絕經(jīng)狀態(tài)、鈣化形態(tài)、鈣化分布及BI-RADS分類中差異均有統(tǒng)計學(xué)意義,與既往研究相符[9-11]。進一步多因素logistic回歸分析證實年齡、BI-RADS分類是預(yù)測乳腺鈣化惡性風(fēng)險的獨立危險因素。因此,本研究納入以上兩個指標(biāo)構(gòu)建了臨床模型,結(jié)果顯示在驗證集中,該模型預(yù)測鈣化惡性風(fēng)險的AUC為0.833,優(yōu)于影像組學(xué)模型。
為進一步探討模型的效能,本研究又聯(lián)合臨床獨立危險因素-影像組學(xué)特征構(gòu)建了聯(lián)合模型,并應(yīng)用ROC曲線比較臨床模型、影像組學(xué)模型、聯(lián)合模型效能,結(jié)果顯示聯(lián)合模型的診斷效能較好,在訓(xùn)練集和驗證集中其AUC均最高,在驗證集中其特異度及準(zhǔn)確度均高于前兩者。聯(lián)合模型特異度、準(zhǔn)確度的提高可以減少假陽性的發(fā)生,避免不必要的活檢和手術(shù),同時降低假陰性,減少乳腺癌漏診率。但在診斷靈敏度方面,聯(lián)合模型不具有優(yōu)勢,在訓(xùn)練集中低于臨床模型,在驗證集中低于影像組學(xué)模型。分析原因可能為聯(lián)合模型采用了年齡、BI-RADS及組學(xué)特征多個分層指標(biāo),因此降低了靈敏度,但其特異度和準(zhǔn)確度均有提高。
列線圖是一種可視化的統(tǒng)計工具,它可以包含多種風(fēng)險因素,因此它的預(yù)測能力比單一風(fēng)險因素更全面[12]。Lei等[8]應(yīng)用影像組學(xué)的方法研究列線圖預(yù)測BI-RADS 4類鈣化的惡性風(fēng)險,并納入絕經(jīng)狀態(tài)為臨床獨立危險因素,結(jié)果顯示驗證集聯(lián)合模型AUC為0.80。Shen等[9]納入年齡、鈣化分布、最大鈣化直徑和鈣化數(shù)量4個危險因素,聯(lián)合組學(xué)特征構(gòu)建了預(yù)測MG無定形鈣化列線圖,結(jié)果顯示驗證集中AUC也為0.80。本研究最后基于聯(lián)合模型構(gòu)建了臨床-影像組學(xué)列線圖,驗證集AUC為0.844,優(yōu)于前兩者。研究結(jié)果的差異考慮可能與病例來源及臨床危險因素的選擇有關(guān)。另外,在本組列線圖中,直觀顯示與年齡相比,BI-RADS分類和影像組學(xué)特征占據(jù)了評分標(biāo)度的較大部分,表明后兩者在預(yù)測鈣化惡性風(fēng)險中起相對主導(dǎo)作用。校準(zhǔn)曲線顯示在訓(xùn)練集及驗證集中,列線圖預(yù)測惡性風(fēng)險值和實際病理之間具有良好的一致性。決策曲線進一步證明該列線圖在預(yù)測乳腺鈣化惡性風(fēng)險方面具有較高的凈獲益。因此,筆者認(rèn)為基于聯(lián)合模型的列線圖可用于預(yù)測乳腺MG鈣化惡性風(fēng)險,其效能優(yōu)于單一的BI-RADS分類和影像組學(xué)。
本研究還存在一些局限性:(1)本研究病例數(shù)總體偏少,且來源于兩家醫(yī)院,機器類型不同,可能導(dǎo)致結(jié)果有偏倚。但研究結(jié)果顯示聯(lián)合模型診斷效能較好,而且一定程度也增加了模型泛化的能力。未來研究中會加大樣本量、進一步細分病例來源深入研究。(2)部分患者為致密型乳腺,圖像未加壓攝片,一些細小多形鈣化顯示不清,易與無定形鈣化混淆;而且有些鈣化形態(tài)特殊,很難完全準(zhǔn)確歸類到分類中,對結(jié)果可能有一些影響。(3)本研究尚缺乏外部驗證,目前無法進一步評估其普遍適用的效能,未來研究將進一步補充收集病例,不同中心病例加以驗證。
綜上所述,本研究證實了基于臨床-影像組學(xué)特征構(gòu)建的聯(lián)合模型對乳腺BI-RADS 4~5類鈣化惡性風(fēng)險預(yù)測效能優(yōu)于單獨臨床模型及單獨影像組學(xué)模型。基于聯(lián)合模型構(gòu)建的列線圖直觀顯示惡性風(fēng)險概率,具有較好的臨床應(yīng)用價值,可以作為乳腺癌篩查的輔助檢測工具。