肖冰冰,袁剛,鄭健,郭建鋒,崔文舉△,江慶△,楊曉冬
(1.上海大學(xué)通信與信息工程學(xué)院,上海 200444;2.中國科學(xué)院蘇州生物醫(yī)學(xué)工程技術(shù)研究所 蘇州 215163;3.南京醫(yī)科大學(xué)附屬蘇州醫(yī)院 蘇州市立醫(yī)院,蘇州 215001)
乳腺癌是女性死亡率最高的惡性腫瘤之一[1-2]。早期篩查和診斷是提高乳腺癌預(yù)后的關(guān)鍵,超聲檢查由于成本低、無輻射及實(shí)時(shí)性等優(yōu)點(diǎn),成為乳腺腫瘤早期篩查的主要方式[3]。但是傳統(tǒng)的灰階超聲檢查在乳腺腫瘤診斷中存在噪聲較多、可重復(fù)性較差、診斷結(jié)果假陽性較高等不足。
彈性超聲成像可以反映乳腺組織和腫瘤組織生物力學(xué)信息,在乳腺腫瘤診治中應(yīng)用日益廣泛[4]。融合灰階超聲與彈性雙模態(tài)超聲影像,有助于降低乳腺腫瘤診斷結(jié)果的假陽性。李易鳳等[5]的研究證明,剪切波超聲結(jié)合Emax可以提高乳腺良惡性腫塊診斷的準(zhǔn)確率和特異性。
影像組學(xué)通過挖掘醫(yī)學(xué)圖像中的高通量特征,可以提取到無法直觀觀察到的影像學(xué)特征,許多研究證明其具有一定輔助診斷能力[6]。在乳腺超聲方面,Qiao等[7]根據(jù)BI-RADS報(bào)告提取的乳腺超聲影像特征,挖掘了更多的數(shù)字影像特征。肖榕等[8]探討了基于灰階超聲的影像組學(xué)預(yù)測乳腺腫瘤良惡性的價(jià)值,其模型的預(yù)測性能與年資10~12年醫(yī)生相當(dāng)。在彈性超聲方面,索靜峰等[9]基于彈性超聲與灰階超聲的雙模態(tài)超聲影像組學(xué)方法評(píng)價(jià)腋窩淋巴結(jié)轉(zhuǎn)移狀態(tài),證明其相比單模態(tài)影像、灰階超聲和彈性超聲,對(duì)腋窩淋巴結(jié)轉(zhuǎn)移狀態(tài)具有更好的診斷性能。
此外,研究表明在乳腺腫瘤發(fā)展過程中,腫瘤周圍微環(huán)境也十分重要。瘤周組織在腫瘤的發(fā)生、發(fā)展、浸潤和轉(zhuǎn)移中起到重要作用,其特征表現(xiàn)為:新生血管數(shù)量和微血管密度增加,免疫相關(guān)細(xì)胞浸潤和細(xì)胞外基質(zhì)重構(gòu),并導(dǎo)致組織硬度增加[10]。腫瘤微環(huán)境包括腫瘤及腫瘤周圍組織,可以通過影像學(xué)方法直觀顯示。基于瘤內(nèi)瘤周影像,Sun等[11]借助影像組學(xué)方法探索了瘤周影像在預(yù)測乳腺腫瘤前哨淋巴結(jié)狀態(tài)中的價(jià)值,發(fā)現(xiàn)來自瘤周區(qū)域的影像特征與乳腺前哨淋巴結(jié)的病理檢查結(jié)果具有相關(guān)性。
本研究基于乳腺灰階超聲和應(yīng)變彈性超聲的雙模態(tài)瘤內(nèi)瘤周影像,構(gòu)建了具有乳腺腫瘤良惡性分類輔助診斷能力的影像組學(xué)模型,探討彈性超聲影像和瘤周影像對(duì)乳腺腫瘤良惡性分類的診斷價(jià)值。
本研究所用圖像數(shù)據(jù)來自蘇州市市立醫(yī)院超聲科,包括2018年1月到2019年12月同時(shí)行灰階超聲及彈性超聲成像的135例患者(其中良性46例,惡性89例),患者的平均年齡為(49±14)歲。采用mindray公司的Resona 7系列超聲診斷儀,探頭型號(hào)為L14-5WU。本研究申請(qǐng)通過醫(yī)院倫理委員會(huì)論證。所有良惡性標(biāo)簽均以病理檢查結(jié)果為金標(biāo)準(zhǔn)。
每個(gè)超聲圖像的腫瘤輪廓ROI區(qū)域由一位具有五年以上臨床經(jīng)驗(yàn)的超聲醫(yī)生勾畫?;译A超聲與應(yīng)變彈性超聲圖像為同機(jī)位同時(shí)采集,在勾畫過程中只對(duì)灰階超聲圖像進(jìn)行勾畫,并映射到彈性超聲圖像上。具體圖像見圖1。其中,圖1(a)為灰階超聲圖像,圖1(b)為應(yīng)變彈性超聲圖像。
腫瘤周圍區(qū)域簡稱為瘤周區(qū)域(peritumor,Peri),具體操作是將勾畫的腫瘤輪廓ROI區(qū)域向周圍擴(kuò)大5 mm,擴(kuò)大的區(qū)域即為瘤周區(qū)域。每個(gè)超聲圖像,最終被劃分為三部分:瘤內(nèi)區(qū)域ROI、瘤周區(qū)域Peri、ROI與Peri的組合區(qū)域(combine,Comb)。由圖1(a)可知,綠色曲線內(nèi)區(qū)域?yàn)镽OI影像,紅色曲線與綠色曲線之間區(qū)域?yàn)镻eri影像,紅色曲線內(nèi)包括綠色曲線內(nèi)區(qū)域?yàn)镃omb影像。
圖1 乳腺病灶的雙模態(tài)超聲圖像
彈性超聲根據(jù)組織的軟硬程度顯示為不同的顏色,根據(jù)色彩條將彈性超聲圖像轉(zhuǎn)換成軟度圖[9],見圖2。
圖2 彩色圖與轉(zhuǎn)換后的軟度值圖
本研究共提取了形態(tài)學(xué)特征、圖像強(qiáng)度特征和紋理特征三類特征。其中,形態(tài)學(xué)特征使用MATLAB(R2018a)編寫代碼進(jìn)行提取,強(qiáng)度特征和紋理特征使用pyradiomics包[12]提取。腫瘤的輪廓勾畫只在灰階超聲上進(jìn)行,形態(tài)學(xué)特征為在灰階超聲上的腫瘤ROI的形態(tài)特征。
形態(tài)學(xué)特征(14個(gè))包括:腫瘤ROI周長、ROI面積、周長面積比、ROI高度、ROI寬度、高度寬度比、圓度、矩形度、伸長度、擬合橢圓長軸長、擬合橢圓短軸長、擬合橢圓長軸與皮膚所夾銳角、最小外接凸多邊形面積、最小外接凸多邊形面積與腫瘤去面積比、分葉數(shù)、葉指數(shù)。
強(qiáng)度特征(18個(gè))主要包括圖像灰度值的一階統(tǒng)計(jì)量,反映灰階圖像的回聲強(qiáng)度和彈性應(yīng)變圖上的應(yīng)變程度。例如百分位數(shù)(10 percentile, 90 percentile)、能量、熵、峰度、偏度、最大值、最小值、均值等。
紋理特征(75個(gè))主要包含灰度共生矩陣(gray level cooccurrence matrix,GLCM)、灰度游程矩陣(gray level run length matrix,GLRLM)、灰度區(qū)域大小矩陣(gray level size zone matrix,GLZM)、灰度相關(guān)矩陣(gray level dependence matrix,GLDM)和相鄰灰度差分矩陣(neighbouring gray tone difference matrix,NGTDM)5個(gè)矩陣的相關(guān)特征。
冗余特征導(dǎo)致分類結(jié)果較差,而特征選擇能有效降低特征維度,刪除冗余特征,提高分類結(jié)果準(zhǔn)確性。本研究使用最小絕對(duì)收縮和選擇算法(least absolute shrinkage and selection operator,Lasso)[13]對(duì)特征進(jìn)行篩選。具體實(shí)現(xiàn)方法為進(jìn)行100次五折交叉驗(yàn)證,選擇分類結(jié)果最好的20組實(shí)驗(yàn),并記錄出現(xiàn)次數(shù)大于或等于15的特征,由于每組實(shí)驗(yàn)的特征本身具有數(shù)據(jù)差異,因此挑選出的特征數(shù)目也不相同。
支持向量機(jī)(support vector machine, SVM)[14]作為影像組學(xué)中常用的分類模型,已在多個(gè)研究中證實(shí)了其模型效果。本實(shí)驗(yàn)中選取SVM作為分類器,對(duì)乳腺腫瘤良惡性進(jìn)行二分類。實(shí)驗(yàn)樣本量有限,因此采用五折交叉驗(yàn)證的方法評(píng)估模型的性能。為消除五折數(shù)據(jù)劃分時(shí)的隨機(jī)性,需獨(dú)立重復(fù)多次五折交叉驗(yàn)證,具體數(shù)值通過分析AUC值的標(biāo)準(zhǔn)差進(jìn)行確定。通過實(shí)驗(yàn)發(fā)現(xiàn)采用100次交叉驗(yàn)證,其標(biāo)準(zhǔn)差小于2%(具體參考表3到表6的結(jié)果),表明本模型具有較高的穩(wěn)定性,故選擇100次五折交叉驗(yàn)證。
實(shí)驗(yàn)數(shù)據(jù)共6組,分別為:超聲ROI影像(B-ROI)、超聲Peri影像(B-Peri)、超聲Comb影像(B-Comb)、彈性超聲ROI影像(E-ROI)、彈性超聲Peri影像(E-Peri)和彈性超聲Comb影像(E-Comb)。
將良性腫瘤作為正樣本,惡性腫瘤作為負(fù)樣本,通過預(yù)測結(jié)果計(jì)算得到真陽性、假陽性、真陰性和假陰性。采用受試者工作特征曲線(receiver operating characteristic curve,ROC)下面積(area under curve,AUC)、準(zhǔn)確率(accurary,Acc)、敏感性(sensitivity,Sen)、特異性(specificity,Spe)作為評(píng)價(jià)指標(biāo)。定義如下:
(1)
(2)
(3)
其中TP、TN、FP、FN的具體含義見表1。
表1 二分類混淆矩陣
本研究的三組對(duì)比實(shí)驗(yàn),分別探討了融合灰階超聲和應(yīng)變彈性超聲雙模態(tài)影像對(duì)乳腺良惡性的輔助診斷價(jià)值,融合瘤內(nèi)瘤周影像的診斷價(jià)值和融合所有影像的診斷價(jià)值。實(shí)驗(yàn)類別及每組實(shí)驗(yàn)所提取的特征數(shù),見表2。
表2 實(shí)驗(yàn)類別及篩選的特征數(shù)目
本研究探討了融合灰階超聲和應(yīng)變彈性超聲雙模態(tài)影像組學(xué)模型對(duì)乳腺腫瘤良惡性的診斷價(jià)值。實(shí)驗(yàn)數(shù)據(jù)包括B-ROI影像、E-ROI影像以及兩種模態(tài)融合的影像,實(shí)驗(yàn)結(jié)果和ROC曲線,見表3和圖3。當(dāng)將兩種模態(tài)影像特征融合時(shí),與單模態(tài)灰階超聲相比,實(shí)驗(yàn)結(jié)果的AUC、準(zhǔn)確率和特異性分別提高了0.0367、0.0089和0.0438。特異性提高較大,說明相比單模態(tài)超聲,融合雙模態(tài)超聲影像對(duì)降低診斷結(jié)果的假陽性具有一定價(jià)值。
表3 灰階超聲ROI與應(yīng)變彈性ROI結(jié)合的分類結(jié)果
圖3 灰階超聲ROI與應(yīng)變彈性ROI結(jié)合的分類結(jié)果ROC曲線
本研究主要對(duì)瘤周影像的診斷價(jià)值作了驗(yàn)證,將B-ROI和B-Peri影像特征融合后,預(yù)測結(jié)果的AUC、準(zhǔn)確率和敏感性均有不同程度的提高,分別為0.0079、0.0085、0.0192,說明瘤周影像對(duì)乳腺良惡性診斷具有一定價(jià)值。此外,通過探索B-Comb影像的診斷價(jià)值,發(fā)現(xiàn)相比分區(qū)域提取特征后建立預(yù)測模型,對(duì)B-Comb完整影像建模得到的結(jié)果更好,實(shí)驗(yàn)結(jié)果及ROC曲線見表4和圖4。AUC、準(zhǔn)確率、特異性和敏感性分別為(0.8396±0.0169)、(0.7898±0.0145)、(0.6332±0.0346)、(0.8784±0.0172),分別高出單區(qū)域B-ROI影像0.0102、0.02081、0.0045和0.0291,說明瘤內(nèi)瘤周影像接合部分有一些重要特征,兩部分影像之間存在某種聯(lián)系,該聯(lián)系與診斷結(jié)果具有相關(guān)性。
圖4 灰階超聲ROI與瘤周結(jié)合的分類結(jié)果ROC曲線
表4 灰階超聲ROI與瘤周結(jié)合的分類結(jié)果
此外,對(duì)于彈性超聲影像融合瘤周影像后,模型的診斷結(jié)果得到極大提高。實(shí)驗(yàn)結(jié)果與ROC曲線見表5和圖5。相比E-ROI影像,E-Comb影像的敏感度提高了0.0737,達(dá)到0.8961,說明瘤周影像與診斷結(jié)果的強(qiáng)相關(guān)性。E-ROI和E-Peri影像特征融合與E-Comb影像兩種融合瘤周影像方式的診斷結(jié)果各有優(yōu)勢,說明兩部分特征對(duì)診斷結(jié)果分別起到不同作用,均有一定診斷價(jià)值。
圖5 應(yīng)變彈性ROI數(shù)據(jù)與瘤周數(shù)據(jù)結(jié)合的分類結(jié)果ROC曲線
表5 應(yīng)變彈性ROI與瘤周結(jié)合的分類結(jié)果
本研究融合B-ROI、B-Peri、E-ROI、E-Peri、B-Comb和E-Comb六組影像特征進(jìn)行特征篩選并建模,最終的分類結(jié)果及ROC曲線見表6和圖6。實(shí)驗(yàn)結(jié)果AUC、準(zhǔn)確率、特異性與敏感性分別為(0.8895±0.0176)、(0.8271±0.0216)、(0.7360±0.0416)、(0.8774±0.0226),與B-ROI單模態(tài)瘤內(nèi)影像相比,分別提高0.0628、0.0581、0.1073、0.0281。其中特異性提高幅度最大,說明融合雙模態(tài)超聲瘤內(nèi)瘤周影像特征能有效降低乳腺腫瘤良惡性分類診斷時(shí)的假陽性。
表6 灰階超聲ROI、應(yīng)變彈性ROI及瘤周結(jié)合的分類結(jié)果
圖6 灰階超聲ROI、應(yīng)變彈性ROI及瘤周結(jié)合的ROC曲線圖
為了驗(yàn)證實(shí)驗(yàn)性能的提高是不同模態(tài)、不同區(qū)域特征融合的結(jié)果,分析3.3所篩選的特征,并計(jì)算特征集差異的顯著性。具體特征和P值見表7。結(jié)果表明,在篩選取得與結(jié)果強(qiáng)相關(guān)的特征集中,灰階超聲包括B-ROI的兩個(gè)特征,B-Peri的一個(gè)特征,B-Comb的兩個(gè)特征,彈性超聲包括E-ROI的兩個(gè)特征,E-Peri的三個(gè)特征,E-Comb的四個(gè)特征。說明融合模型的雙模態(tài)瘤內(nèi)瘤周影像特征與診斷結(jié)果均有一定的相關(guān)性,各模態(tài)、各區(qū)域影像對(duì)乳腺腫瘤良惡性分類都具有一定的診斷價(jià)值。此外,在篩選的特征中,與結(jié)果獨(dú)立強(qiáng)相關(guān)的特征(P<0.001)有9個(gè),其特征具有獨(dú)立的診斷價(jià)值;其他5個(gè)特征雖然與結(jié)果不存在獨(dú)立強(qiáng)相關(guān)性,但特征組合與結(jié)果具有強(qiáng)相關(guān)性,因此,同樣具有診斷價(jià)值。
表7 3.4融合模型特征集顯著性分析
本研究探討了融合灰階超聲和應(yīng)變彈性超聲雙模態(tài)及瘤內(nèi)瘤周影像對(duì)乳腺腫瘤良惡性分類的診斷價(jià)值?;诨译A超聲和應(yīng)變彈性超聲影像,首先手動(dòng)分割腫瘤區(qū)域,通過算法得到瘤周區(qū)域,然后對(duì)灰階超聲ROI數(shù)據(jù)、應(yīng)變彈性超聲ROI數(shù)據(jù)及瘤周區(qū)域進(jìn)行特征提取,使用LASSO回歸實(shí)現(xiàn)特征篩選,最終通過SVM分類器得到良惡性腫瘤分類結(jié)果。實(shí)驗(yàn)結(jié)果表明,融合灰階超聲和應(yīng)變彈性超聲瘤內(nèi)瘤周影像后,診斷結(jié)果得到不同程度的提升,其中,將六組影像特征融合后建立的模型的診斷結(jié)果最好,AUC達(dá)到0.8895,相比單模態(tài)B-ROI影像提高了0.0628,特異性達(dá)到0.736,提高了0.1073。說明融合灰階超聲、彈性超聲瘤內(nèi)瘤周影像對(duì)乳腺腫瘤良惡性診斷,能有效解決常規(guī)超聲診斷假陽性偏高的問題,對(duì)超聲乳腺腫瘤良惡性診斷具有重要的指導(dǎo)意義。