張恒,趙彤,張賽,孫佳偉,李曉琴,倪昕曄
1. 南京醫(yī)科大學(xué)附屬常州第二人民醫(yī)院 a. 放療科;b. 超聲科,江蘇 常州 213003;2. 江蘇省醫(yī)學(xué)物理工程研究中心,江蘇 常州 213003;3. 南京醫(yī)科大學(xué) 醫(yī)學(xué)物理研究中心,江蘇 常州 213003;4. 江蘇省常州市醫(yī)學(xué)物理重點(diǎn)實(shí)驗(yàn)室,江蘇 常州 213003
乳腺癌在全球女性癌癥患者中發(fā)病率居高不下[1]。在大多數(shù)乳腺癌中,新輔助化療(Neoadjuvant Chemotherapy,NAC)已成為一種標(biāo)準(zhǔn)治療手段[2],能夠有效降低癌癥分期、淋巴結(jié)轉(zhuǎn)移率并提高保乳治療的可能性[3]。此外,NAC 后達(dá)到病理完全緩解(Pathological Complete Response,pCR)的患者生存期可顯著提升[4]。而對(duì)治療不敏感的患者將面臨手術(shù)延遲和癥狀加重的風(fēng)險(xiǎn)。早期預(yù)測乳腺癌患者NAC 后的pCR 狀態(tài),可以輔助醫(yī)師及時(shí)調(diào)整治療方案,避免患者出現(xiàn)NAC 的嚴(yán)重毒副作用。
影像組學(xué)作為一種非侵入性分析腫瘤輪廓的新興技術(shù),可以提供整個(gè)腫瘤在宏觀和微觀方面的全面表征[5]。深度學(xué)習(xí)也已被證實(shí)在醫(yī)學(xué)圖像任務(wù)中效果優(yōu)異[6],但往往受限于臨床樣本量[7],將在自然圖像中預(yù)訓(xùn)練完成的模型直接應(yīng)用于醫(yī)學(xué)圖像任務(wù)中,僅利用提取到的深度學(xué)習(xí)特征結(jié)合機(jī)器學(xué)習(xí)模型也可以取得較好的預(yù)測效果。截至目前,融合深度學(xué)習(xí)和影像組學(xué)技術(shù)預(yù)測乳腺癌NAC 后pCR 狀態(tài)的研究仍鮮有報(bào)道,尤其是基于超聲圖像。超聲與MRI 和CT 相比,具有安全、便宜和實(shí)時(shí)成像等優(yōu)勢[8]。本研究旨在探討結(jié)合臨床和超聲深度學(xué)習(xí)、影像組學(xué)特征的綜合模型預(yù)測乳腺癌患者NAC 后pCR 的價(jià)值。
本研究的總體工作流程圖如圖1 所示。回顧性分析2015 年1 月至2022 年9 月在我院接受NAC 的乳腺癌患者。納入標(biāo)準(zhǔn):① NAC 前經(jīng)穿刺活檢病理證實(shí)為乳腺癌;② 無既往放化療病史并在本院接受完整的NAC 治療;③ NAC 后經(jīng)病理證實(shí)為pCR 或非pCR(NpCR);④ 有完整的臨床病理學(xué)資料(NAC 方案也記錄完整)。排除標(biāo)準(zhǔn):① 超聲圖像偽影嚴(yán)重或未能完全顯示病灶邊界或錯(cuò)誤的超聲掃描模式;② 同側(cè)乳腺多發(fā)病灶或雙側(cè)乳腺均發(fā)生病變(惡性);③ NAC 期間發(fā)生遠(yuǎn)處轉(zhuǎn)移;④ 有其他惡性腫瘤病史。符合條件的共117 例患者,均為女性,采用7 ∶3 的比例隨機(jī)劃分訓(xùn)練和驗(yàn)證集。本研究經(jīng)醫(yī)院倫理委員會(huì)審批同意(批準(zhǔn)文號(hào):[2020]KY154-01)。
圖1 總體工作流程圖
所有檢查均由具有5 年以上淺表器官超聲診斷工作經(jīng)驗(yàn)的醫(yī)師完成,采用EPIQ5、IU22(Philips,荷蘭),Easote Mylabe Twice,GE Logiq E9、E10,西門子s2000超聲診斷儀和高頻線陣探頭,探頭頻率為7~12 MHz,6~15 MHz,選取乳腺超聲檢查模式。檢查時(shí)患者取仰臥位,雙臂上舉以充分暴露乳腺,對(duì)雙側(cè)乳腺各個(gè)象限進(jìn)行多切面掃查,對(duì)病灶區(qū)域進(jìn)行重點(diǎn)掃查,并根據(jù)病灶大小調(diào)節(jié)深度。獲取乳腺原發(fā)病灶最大長軸、短軸切面聲像圖?;颊咚谐暀z查均于NAC治療前2周內(nèi)完成,每例患者僅采用1張超聲圖像納入本研究。
患者的臨床資料包括年齡、左/右乳、臨床分期、腋窩淋巴結(jié)是否轉(zhuǎn)移、病理類型、雌激素受體(Estrogen Receptor,ER)、孕激素受體(Progesterone Receptor,PR)、人體表皮生長因子受體2(Human Epidermal Growth Factor Receptor-2,HER-2)、腫瘤增殖細(xì)胞核抗原67(Tumor Expression of the Proliferation Antigen,Ki-67)。本研究中將ER、PR 免疫組化染色≥1%、HER-2 表達(dá)≥+++或熒光原位雜交法檢測陽性定義為陽性,反之為陰性。Ki-67 ≥14%定義為Ki-67 高表達(dá),<14%定義為Ki-67 低表達(dá)[9]。
根據(jù)中國抗癌協(xié)會(huì)乳腺癌指南[10],NAC 方案主要以蒽環(huán)類、紫杉類或蒽環(huán)類與紫杉類結(jié)合為基礎(chǔ)。參照美國腫瘤聯(lián)合會(huì)乳腺癌分期系統(tǒng)(第8 版)對(duì)NAC療效評(píng)估,將其分為pCR(術(shù)后乳腺和淋巴結(jié)病理學(xué)檢查未殘留任何浸潤癌組織或僅殘存原位癌)與NpCR(術(shù)后乳腺和淋巴結(jié)病理學(xué)檢查殘留浸潤癌組織)[11]。
將乳腺癌患者的原始超聲圖像導(dǎo)入3D Slicer 軟件(4.11 版本),由1 名具有5 年以上工作經(jīng)驗(yàn)的超聲科醫(yī)師,在未知臨床結(jié)果的情況下沿著腫瘤輪廓分割感興趣區(qū)域(Region of Interest,ROI)。由具有10 年以上經(jīng)驗(yàn)的高年資超聲科主任醫(yī)師進(jìn)行最終驗(yàn)證,并通過討論解決分歧,以確保病灶分割的準(zhǔn)確性。
基于分割后的ROI 和原圖像進(jìn)行影像組學(xué)特征提取。利用Pyradiomics 包(V3.0.1)對(duì)每例患者的超聲圖像提取人工定義的影像組學(xué)特征(https://pyradiomics.readthedocs.io/en/latest/),包括一階統(tǒng)計(jì)量特征、二維形狀特征、紋理特征、小波特征,分為2 個(gè)維度4 種頻帶(HH、HL、LH、LL)。
采用ResNet50[12]架構(gòu)作為提取深度學(xué)習(xí)特征的基線模型,并事先在大規(guī)模、注釋良好的ImageNet 數(shù)據(jù)集上進(jìn)行預(yù)訓(xùn)練。預(yù)訓(xùn)練之后,網(wǎng)絡(luò)權(quán)重采用imageNet權(quán)重,并去除ResNet50 網(wǎng)絡(luò)的最后一個(gè)全連接層,使用全局最大池化獲取每層深度學(xué)習(xí)特征圖映射的最大值,以將特征映射轉(zhuǎn)換為原始值,輸入到機(jī)器學(xué)習(xí)模型中構(gòu)建深度學(xué)習(xí)模型。
為了避免樣本不均衡對(duì)模型性能造成影響(樣本傾向于被分類到多數(shù)類),首先采用人工少數(shù)類過采樣方法(Synthetic Minority Over-Sampling Technique,SMOTE)對(duì)訓(xùn)練集數(shù)據(jù)進(jìn)行過采樣至1 ∶1。然后根據(jù)公式(1)對(duì)全體數(shù)據(jù)進(jìn)行Z-Score 歸一化處理,將不同量級(jí)的特征數(shù)據(jù)轉(zhuǎn)換為同一量級(jí),確保特征間的可比性,也便于后續(xù)篩選算法的應(yīng)用。
式中,x為原始數(shù)據(jù);為平均數(shù);s為標(biāo)準(zhǔn)差。
在訓(xùn)練集中首先使用Mann-WhitneyU檢驗(yàn)初步篩選與pCR 狀態(tài)具有統(tǒng)計(jì)學(xué)意義的特征,然后基于隨機(jī)森林的遞歸消除算法(Recursive Feature Elimination,RFE)和10倍交叉驗(yàn)證的最小絕對(duì)收縮和選擇算子(Least Absolute Shrinkage and Selection Operator,LASSO) 進(jìn)行特征降維,選擇交叉驗(yàn)證二項(xiàng)偏差最小的數(shù)據(jù)集作為最優(yōu)特征集,并基于最優(yōu)特征集構(gòu)建影像組學(xué)/深度學(xué)習(xí)標(biāo)簽,計(jì)算方式如公式(2)所示。
式中,intercept 為LASSO 模型擬合訓(xùn)練集數(shù)據(jù)后得到的截距;feature 為LASSO 篩選后的特征;Coef 為特征的回歸系數(shù);features 為篩選后的特征個(gè)數(shù)。
利用單/多因素邏輯回歸分析篩選有價(jià)值的臨床特征,并與影像組學(xué)/深度學(xué)習(xí)標(biāo)簽構(gòu)建綜合模型。此外,還單獨(dú)構(gòu)建了臨床、影像組學(xué)和深度學(xué)習(xí)模型,用于對(duì)比分析。本研究所采用的機(jī)器學(xué)習(xí)分類器為邏輯回歸模型,受試者工作特征(Receiver Operating Characteristic,ROC)曲線下面積(Areas Under Curve,AUC)、準(zhǔn)確度、特異性、敏感度4 類評(píng)價(jià)指標(biāo)用于評(píng)估模型的性能,其中AUC 的95%CI是通過1000 次重抽樣獲得,并利用DeLong 測試比較不同模型AUC 間的差異。通過校準(zhǔn)曲線檢驗(yàn)?zāi)P偷男?zhǔn)能力,決策曲線分析用來評(píng)估模型的臨床實(shí)用性。
本研究的統(tǒng)計(jì)分析基于SPSS 22.0 軟件。對(duì)于定量資料以±s表示,組間比較行獨(dú)立樣本t檢驗(yàn)。對(duì)于定性資料以例表示,組間比較行χ2檢驗(yàn)。以P<0.05 為差異有統(tǒng)計(jì)學(xué)意義。
患者的原始臨床資料如表1 所示,為了與影像組學(xué)和深度學(xué)習(xí)特征相匹配,同樣對(duì)訓(xùn)練組臨床數(shù)據(jù)進(jìn)行SMOTE,過采樣后的臨床數(shù)據(jù)如表2 所示。訓(xùn)練集中pCR 與NpCR 組患者間臨床分期、ER、PR 和Ki-67差異有統(tǒng)計(jì)學(xué)意義(P<0.001、P<0.001、P=0.013 和P=0.002)。而在驗(yàn)證集中,pCR 與NpCR 的患者之間僅PR 差異有統(tǒng)計(jì)學(xué)意義(P=0.049)??紤]到驗(yàn)證集中樣本量遠(yuǎn)少于訓(xùn)練集,故將在訓(xùn)練集中差異有統(tǒng)計(jì)學(xué)意義的臨床特征:臨床分期、ER、PR 和Ki-67 均納入單/多因素邏輯回歸分析(表3),以篩選用于構(gòu)建臨床模型的最終特征,結(jié)果顯示臨床分期和ER 為pCR狀態(tài)的獨(dú)立預(yù)測因子(P=0.002,P<0.001),可用于構(gòu)建臨床模型。
表1 原始訓(xùn)練和驗(yàn)證集患者臨床特征比較( ±s,n)
表1 原始訓(xùn)練和驗(yàn)證集患者臨床特征比較( ±s,n)
注:ER:雌激素受體;PR:孕激素受體;HER-2:人體表皮生長因子受體2;Ki-67:腫瘤增殖細(xì)胞核抗原67;pCR:病理完全緩解;NpCR:非病理完全緩解。
臨床特征訓(xùn)練集(n=81)驗(yàn)證集(n=36)pCR(n=17) NpCR(n=64)t/χ2值P值pCR(n=7)NpCR(n=29)t/χ2值P值年齡/歲55.59±12.7956.00±12.070.1240.90260.71±11.9152.48±11.431.6970.099左/右乳0.5800.4460.1770.674左乳733414右乳1031315臨床分期2.4390.2950.7980.671Ⅰ0 3 1 2Ⅱ1129519 3218腋窩淋巴結(jié)0.0600.8060.6200.431未轉(zhuǎn)移31338轉(zhuǎn)移1451421病理類型-1.0000.4030.526浸潤性癌1764627其他0012 ER4.0510.0440.8560.355陰性1124411陽性640318 PR0.5140.4743.8720.049陰性82459陽性940220 HER-22.3630.1242.6800.102陰性636114陽性1128615 Ki-672.6890.1010.2480.618低表達(dá)0901高表達(dá)1755728Ⅲ6
表2 SMOTE后訓(xùn)練和驗(yàn)證集患者臨床特征比較( ±s,n)
表2 SMOTE后訓(xùn)練和驗(yàn)證集患者臨床特征比較( ±s,n)
注:ER:雌激素受體;PR:孕激素受體;HER-2:人體表皮生長因子受體2;Ki-67:腫瘤增殖細(xì)胞核抗原67;pCR:病理完全緩解;NpCR:非病理完全緩解。
臨床特征訓(xùn)練集(n=128)驗(yàn)證集(n=36)pCR(n=64) NpCR(n=64) t/χ2值P值pCR(n=7)NpCR(n=29)t/χ2值P值年齡/歲54.22±11.1956.00±12.070.8660.38860.71±11.9152.48±11.431.6970.099左/右乳1.1430.2850.1770.674左乳3933414右乳2531315臨床分期22.054 <0.0010.7980.671Ⅰ0 3 1 2Ⅱ5429519 103218腋窩淋巴結(jié)0.0470.8280.6200.431未轉(zhuǎn)移141338轉(zhuǎn)移5051421病理類型-1.0000.4030.526浸潤性癌6464627其他0012 ER25.393 <0.0010.8560.355陰性5224411陽性1240318 PR6.1310.0133.8720.049陰性382459陽性2640220 HER-20.2900.5902.6800.102陰性3936114陽性2528615 Ki-679.6810.0020.2480.618低表達(dá)0901高表達(dá)6455728Ⅲ
表3 臨床數(shù)據(jù)的單/多因素邏輯回歸分析
從超聲圖像中提取了469 個(gè)影像組學(xué)特征,通過Mann-WhitneyU檢驗(yàn)、RFE 和LASSO 將其進(jìn)一步降維至6 個(gè)與pCR 狀態(tài)密切相關(guān)的特征(圖2a~c)。按照公式(2)構(gòu)建影像組學(xué)標(biāo)簽,影像組學(xué)標(biāo)簽=0.5000-0.1982×original_shape_Maximum2DDiameterRow-0.0344×original_glcm_ClusterShade+0.0603×wavelet-LH_glszm_SmallAreaLowGrayLevelEmphasis+0.0172×wavelet-HL_glszm_SmallAreaLowGrayLevelEmphasis+0.0740×wavelet-HL_gldm_SmallDependenceLowGrayLevelEmphasis+0.0816×wavelet-HH_firstorder_Mean。隨后基于影像組學(xué)標(biāo)簽和邏輯回歸分類器構(gòu)建影像組學(xué)模型,訓(xùn)練集AUC 為0.815,驗(yàn)證集AUC 為0.778。
圖2 基于LASSO算法的影像組學(xué)和深度學(xué)習(xí)特征篩選
基于ResNet50 網(wǎng)絡(luò)共提取了2048 個(gè)深度學(xué)習(xí)特征,經(jīng)Mann-WhitneyU檢驗(yàn)、RFE 和LASSO 最終降維至8 個(gè)與pCR 狀態(tài)緊密相關(guān)的特征(圖2d~f)。根據(jù)公式(2)構(gòu)建深度學(xué)習(xí)標(biāo)簽,基于深度學(xué)習(xí)標(biāo)簽和邏輯回歸分類器構(gòu)建深度學(xué)習(xí)模型,訓(xùn)練集AUC 為0.928,驗(yàn)證集AUC 為0.901。
基于邏輯回歸分類器開發(fā)了聯(lián)合臨床分期、ER、影像組學(xué)標(biāo)簽和深度學(xué)習(xí)標(biāo)簽構(gòu)建的綜合模型。表4 展示了基于邏輯回歸的各模型預(yù)測性能,其中綜合模型在訓(xùn)練集中AUC 為0.949;驗(yàn)證集中AUC 為0.931,顯著優(yōu)于其他模型。DeLong 測試結(jié)果(表5)顯示,綜合模型在訓(xùn)練集上與臨床和影像組學(xué)模型AUC 間差異具有統(tǒng)計(jì)學(xué)意義,而在驗(yàn)證集上僅與臨床模型AUC 間差異顯著。圖3a~b 為各模型在訓(xùn)練集和驗(yàn)證集上的ROC 曲線,可更直觀評(píng)價(jià)綜合模型與子模型間性能差異。圖3c顯示了4 種模型的校準(zhǔn)曲線,其中,綜合模型的校準(zhǔn)曲線對(duì)角線擬合度優(yōu)于其他模型,表明綜合模型對(duì)乳腺癌NAC 患者術(shù)前pCR 的預(yù)測更為可靠。圖3d 為每個(gè)模型的決策曲線,其均高于兩條參考曲線,表明各模型均具有臨床收益,其中,綜合模型的收益最多。
表5 綜合模型與各子模型間DeLong測試結(jié)果
圖3 綜合模型性能評(píng)估
在本研究中,構(gòu)建了一個(gè)聯(lián)合乳腺癌患者NAC 前超聲影像的臨床、影像組學(xué)和深度學(xué)習(xí)特征的綜合模型,可以在術(shù)前更精準(zhǔn)、無創(chuàng)地預(yù)測乳腺癌患者NAC 后的pCR 狀態(tài),可為乳腺癌NAC 患者的個(gè)性化治療提供指導(dǎo)。
影像組學(xué)作為人工智能在醫(yī)學(xué)影像中的新技術(shù),可以從超聲、MRI 和CT 等醫(yī)學(xué)圖像中提取高維影像特征,以更全面地描述乳腺腫瘤[13-14]。目前已有研究報(bào)道影像組學(xué)在乳腺癌預(yù)后預(yù)測中的價(jià)值[15-17],但多數(shù)研究主要集中于CT 和MRI 方面。與MRI 和CT 相比,超聲成本更低、操作更簡單、圖像更容易獲得,在術(shù)前評(píng)估乳腺癌pCR 方面具有更大的臨床和經(jīng)濟(jì)效益[18]。Yang 等[19]對(duì)比了治療前和治療早期超聲影像組學(xué)特征的變化,發(fā)現(xiàn)兩者間的差值與乳腺癌NAC 反應(yīng)獨(dú)立相關(guān),證明了基于超聲的影像組學(xué)特征可用于術(shù)前預(yù)測乳腺癌患者NAC 后的療效。李蔓英等[20]從53 例乳腺癌患者的灰階超聲圖像中提取1044 個(gè)影像組學(xué)特征,建立了基于6 個(gè)影像組學(xué)特征的邏輯回歸模型,AUC 為0.880。然而,該項(xiàng)研究包含的樣本量較小,且僅基于單一影像組學(xué)技術(shù),導(dǎo)致了模型預(yù)測性能有限。本研究引入了全新的深度學(xué)習(xí)技術(shù)來提取超聲內(nèi)部的深度特征。結(jié)果表明,所提取的深度特征在乳腺癌患者NAC 療效預(yù)測方面比影像組學(xué)特征更優(yōu),這表明深度特征可能是非常有價(jià)值的預(yù)測pCR 新指標(biāo),且可能與影像組學(xué)特征間存在互補(bǔ)關(guān)系。接下來,本研究考慮了一些臨床預(yù)后因素。經(jīng)單/多因素邏輯回歸分析表明,臨床分期、ER 是區(qū)別乳腺癌患者NAC 后pCR 狀態(tài)的獨(dú)立預(yù)測因子,被納入構(gòu)建綜合模型。在驗(yàn)證集中,綜合模型的AUC 和準(zhǔn)確度達(dá)到了0.931 和0.833,與現(xiàn)有基于影像組學(xué)和臨床特征的研究相比,性能有一定的提升。且與既往部分研究需提取NAC 治療前及治療中的超聲圖像特征進(jìn)行對(duì)比分析,才能做出準(zhǔn)確療效預(yù)測相比,本文僅需利用NAC 治療前的超聲圖像,有助于將臨床決策的時(shí)間點(diǎn)前移。
本研究的創(chuàng)新點(diǎn)在于融合了深度學(xué)習(xí)特征,構(gòu)建了聯(lián)合影像組學(xué)、深度學(xué)習(xí)及臨床特征的綜合模型,提升了預(yù)測性能,且具有高效快捷、無創(chuàng)無輻射等優(yōu)點(diǎn)。同時(shí)本研究也有一些局限性:① 屬于單中心回顧性研究,樣本量較小且缺乏外部獨(dú)立測試集驗(yàn)證,下一步將繼續(xù)擴(kuò)大樣本量,并展開多中心研究;② ROI 屬于人工勾畫,可能存在一定的人為因素對(duì)特征提取造成偏差,后續(xù)研究中,將致力于使用深度學(xué)習(xí)自動(dòng)分割網(wǎng)絡(luò)來減少人工參與。
綜上所述,本文利用超聲影像組學(xué)和深度學(xué)習(xí)技術(shù)并結(jié)合臨床特征,建立了預(yù)測乳腺癌患者NAC 后pCR狀態(tài)的綜合模型,在驗(yàn)證集中獲得了良好效果,可為臨床pCR 診斷提供有效的參考。