張舒妮,趙楠楠,李陽,朱蕓,楊靜茹,張澳琪,顧一泓,謝宗玉*
作者單位 1.蚌埠醫(yī)科大學(xué)第一附屬醫(yī)院放射科,蚌埠 233004;2.蚌埠醫(yī)科大學(xué)研究生院,蚌埠 233004
根據(jù)2023 年美國癌癥協(xié)會最新統(tǒng)計,乳腺癌已超過肺癌成為威脅女性生命健康的第一危險因素,預(yù)計2023 年新發(fā)病例超過29 萬,發(fā)病率占女性新增癌癥病例的31%[1-2]。乳腺癌是一種侵襲性很強的癌癥,包括多種病理類型,其中浸潤性導(dǎo)管癌(invasive ductal carcinoma, IDC)占據(jù)大約70%[3],其生存期因診斷階段及病理類型的不同而有很大差異,腋窩淋巴結(jié)(axillary lymph node, ALN)是否轉(zhuǎn)移對乳腺癌患者的臨床分期、預(yù)后評估和個性化治療方案至關(guān)重要[4]。臨床醫(yī)生曾認為乳腺癌的標(biāo)準治療是乳房根治術(shù)加ALN 清掃術(shù)(axillary lymph node dissection, ALND),但是經(jīng)研究發(fā)現(xiàn),部分患者存在過度治療的現(xiàn)象,經(jīng)ALND 的患者會出現(xiàn)上肢水腫、肩關(guān)節(jié)疼痛、麻木及活動障礙等并發(fā)癥,嚴重影響患者的生活質(zhì)量[5]。近年來,前哨淋巴結(jié)活檢(sentinel lymph node biopsy,SLNB)憑借著侵入性小、并發(fā)癥少的優(yōu)點,逐步取代ALND成為乳腺癌ALN評估的標(biāo)準術(shù)式,但是SLNB與潛在的高假陰性率相關(guān),假陰性率在5%~10%之間,而且對血管和神經(jīng)具有一定的損害[6]。因此,現(xiàn)階段迫切需要一種安全、無創(chuàng)的方法來評估ALN 狀態(tài),并且避免在無ALN 轉(zhuǎn)移的患者中進行侵入性的操作,改善患者的預(yù)后以及生活質(zhì)量。臨床上,常采用淋巴結(jié)觸診來初步診斷患者ALN 狀態(tài),但是該方法依賴于臨床醫(yī)師的工作經(jīng)驗、患者皮下脂肪厚度以及配合程度,假陰性率高達45%[7]。影像學(xué)檢查常采用鉬靶(mammography, MG)、MRI 以及超聲來評估乳腺癌分期以及ALN 狀態(tài),但是根據(jù)影像學(xué)特征判斷ALN 狀態(tài)依賴于放射科醫(yī)生的工作經(jīng)驗,主觀性較強[8],而且這些檢查方法各有優(yōu)缺點,MG對鈣化敏感度比較高,對部分致密型腺體的檢出率低,MRI是多方位、多參數(shù)、多序列成像,對軟組織分辨能力較高,能夠準確鑒別囊性及實性病變,但是對于微小鈣化不敏感,因此將MG 與MRI 聯(lián)合能夠更加全面地獲得病灶信息。影像組學(xué)是指高通量地提取影像學(xué)特征,挖掘圖像中更深層次的信息,近年來在腫瘤學(xué)中應(yīng)用廣泛,可以提高診斷、預(yù)測的準確性。既往研究[9-10]大多基于單一MG/MRI 模態(tài)或臨床病理資料,并且選擇單一的機器學(xué)習(xí)分類器構(gòu)建影像組學(xué)模型,無法篩選出效能最佳的模型,獲得的腫瘤信息有限,目前尚未發(fā)現(xiàn)將MG 及MRI 聯(lián)合并且基于多種機器學(xué)習(xí)分類器構(gòu)建的影像組學(xué)模型預(yù)測患者ALN 狀態(tài)的相關(guān)研究。本研究探討基于多種機器學(xué)習(xí)的多模態(tài)影像組學(xué)術(shù)前預(yù)測乳腺癌患者ALN轉(zhuǎn)移的價值,全面提取了每種影像方法的組學(xué)特征,并聯(lián)合臨床高危因素構(gòu)建列線圖模型,預(yù)測乳腺癌患者術(shù)前ALN 狀態(tài),可以實現(xiàn)以非侵入的方式協(xié)助臨床制訂科學(xué)有效的診療方案。
回顧性分析2019 年1 月至2023 年6 月在蚌埠醫(yī)科大學(xué)第一附屬醫(yī)院經(jīng)手術(shù)病理證實為IDC 患者的臨床及影像資料。納入標(biāo)準:(1)術(shù)前及穿刺前常規(guī)行乳腺MRI 及MG 檢查且圖像清晰;(2)病理結(jié)果為IDC,并且有完整的ALN 狀態(tài)病理記錄;(3)術(shù)前未接受任何輔助性治療;(4)MG 與MRI 檢查的間隔時間不超過1 周。排除標(biāo)準:(1)病灶過小或者邊界顯示不清,不能進行感興趣區(qū)勾畫;(2)隱匿性、復(fù)發(fā)性乳腺癌;(3)其他惡性腫瘤病史、全身病變明顯或合并遠處轉(zhuǎn)移。最終納入224例患者資料進行分析,所有患者均為女性。本研究遵循《赫爾辛基宣言》,經(jīng)蚌埠醫(yī)科大學(xué)第一附屬醫(yī)院醫(yī)學(xué)倫理委員會批準,免除受試者知情同意,批準文號:2023-441。
1.2.1 儀器設(shè)備
所有MG 圖像均采用德國Siemens Mammomat Inspiration 乳腺X 線攝影機檢查獲得,行頭尾位和內(nèi)外斜位標(biāo)準雙體位投照。
MRI 檢查均使用荷蘭Philips Achieva 3.0 T 雙梯度超導(dǎo)型MRI 掃描儀,SENSE 7 通道乳腺專用線圈?;颊卟扇「┡P位,雙側(cè)乳房自然對稱地落入線圈,定位中心對準線圈中心及兩側(cè)乳頭連線中點。囑咐患者盡量降低呼吸頻率,以避免呼吸和心跳引起的運動偽影。MRI 掃描序列和參數(shù):(1) T1WI 序列,TR 400 ms,TE 10 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣216×194;(2)T2WI 序列,TR 5000 ms,TE 60 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣260×274;(3)擴散加權(quán)成像(diffusion-weighted imaging, DWI),TR 2500 ms,TE 40 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣184×95,b=0、800 s/mm2;(4)DCE-MRI,TR 4.8 ms,TE 2.4 ms,層厚5 mm,層間距1 mm,F(xiàn)OV 350 mm×350 mm,矩陣252×339。分6 個時相采集圖像,每個時相掃描60 s,第一個時相為蒙片像,然后經(jīng)肘正中靜脈迅速注入劑量為0.2 mmol/kg的對比劑釓噴酸葡胺(拜耳先靈醫(yī)藥公司,德國),隨后以流速1.5 mL/s注射生理鹽水20 mL。
1.2.2 臨床特征分析
收集患者臨床資料,如年齡、臨床T分期、觸診及中性粒細胞絕對值(absolute neutrophil count, N)(單位:×109/L)、淋巴細胞絕對值(absolute lymphocyte count, L)(單位:×109/L)及血小板計數(shù)(platelet count, P)(單位:×109/L)等臨床指標(biāo),其中生化指標(biāo)均來源于患者治療前一周的血常規(guī)檢查結(jié)果。計算中性粒細胞-淋巴細胞比率(neutrophil lymphocyte ratio, NLR)、血小板- 淋巴細胞比率(platelet lymphocyte rate, PLR),計算公式見式(1)~(2)。
1.2.3 影像特征分析
影像特征由兩名分別具有5 年以上乳腺診斷經(jīng)驗的主治醫(yī)師在Philips Extended MR Workspace 后處理工作站上進行分析。主要評價指標(biāo)包括:病灶最大徑、病灶形態(tài)、腫塊內(nèi)部強化特點、表觀擴散系數(shù)(apparent diffusion coefficient, ADC)、時間-信號強度曲線(time-signal intensity curve, TIC)類型、背景實質(zhì)強化(background parenchymal enhancemennt, BPE)、毛刺征、鈣化、腺體類型、BI-RADS 分類、MRI_ALN及MG_ALN 等。既往研究發(fā)現(xiàn)發(fā)生ALN 轉(zhuǎn)移的淋巴結(jié)特點包括:形狀飽滿、短徑明顯增大或較對側(cè)明顯增大、淋巴門結(jié)構(gòu)消失、邊緣模糊不清、密度增加等[11]。當(dāng)兩名醫(yī)師對判讀結(jié)果出現(xiàn)分歧時,通過商議達成一致。
1.2.4 圖像分割和特征提取
病灶的分割與特征提取在醫(yī)準智能科技有限公司的達爾文智能科研平臺(http://www.yizhun-ai.com)上完成。由兩名具有5 年以上乳腺診斷經(jīng)驗的主治醫(yī)師在未接觸患者臨床及病理資料的情況下間隔一周時間先后在DCE-MRI 序列第二期圖像上勾畫最大層面,并復(fù)制到T2WI 圖像上,再嚴格根據(jù)病灶在不同序列的實際形態(tài)調(diào)整ROI范圍;最后在MG的頭尾位及內(nèi)外斜位圖像上對病灶進行局部放大,勾畫病灶(圖1),統(tǒng)一勾畫標(biāo)準。
圖1 女,63 歲,病理證實為乳腺浸潤性導(dǎo)管癌,腋窩淋巴結(jié)狀態(tài)為陰性,臨床觸診未觸及腫塊,MRI及MG 示右乳外下象限不規(guī)則腫塊。1A:MG 頭尾位原始圖像及ROI勾畫圖;1B:MG內(nèi)外斜位原始圖像及ROI勾畫圖;1C: T2WI圖像病灶最大層面原始圖像及ROI勾畫圖;1D:DCE-MRI第二期病灶最大層面原始圖像及ROI勾畫圖。黃線范圍內(nèi)為病灶ROI。MG:鉬靶;ROI:感興趣區(qū);DCE-MRI:動態(tài)對比增強MRI。Fig.1 A 63-year-old female is pathologically confirmed to be invasive ductal carcinoma of the breast, the axillary lymph node status is negative, the mass is not palpated on clinical palpation, and the MRI and MG show an irregular mass in the outer lower quadrant of the right breast.1A: Raw image and ROI outline of the head and tail position of the mammography target; 1B: Raw image and ROI outline of the internal and external oblique position of the mammography target; 1C:Maximal image and ROI outline of the magnetic resonance T2WI image lesion; 1D: Maximal image and ROI outline of DCE-MRI stage Ⅱ lesion.Within the yellow line is the ROI of the lesion.MG: mammography; ROI: region of interest; DCE-MRI: dynamic contrast-enhanced MRI.
1.2.5 特征篩選與機器學(xué)習(xí)
ROI 勾畫完成后對特征進行提取及處理。首先通過最大最小值歸一化將提取的特征值預(yù)處理至(0,1)之間,計算組內(nèi)相關(guān)系數(shù)(intra-class correlation coefficient, ICC),保留ICC>0.75 的特征,然后通過樣本方差F值評估特征與乳腺癌ALN 是否轉(zhuǎn)移的線性相關(guān)性,采用最優(yōu)特征篩選-百分比進行特征降維,多模態(tài)、MRI及MG影像組學(xué)模型的篩選閾值百分比分別為34%、19%及38%;通過最小絕對收縮和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸對特征再次進行降維,通過最優(yōu)超參數(shù)篩選得到最主要特征,并且選擇均衡準確率(balanced_accuracy)作為評估特征重要性的評價標(biāo)準;將多模態(tài)影像組學(xué)篩選出的特征分別納入5種機器學(xué)習(xí)分類器中構(gòu)建多模態(tài)影像組學(xué)模型預(yù)測ALN狀態(tài)。分類器包括支持向量機(support vector machine, SVM)、K 近鄰(K nearest neighbors, KNN)、極端梯度提升決策樹(extreme gradient boosting,XGBoost)、邏輯回歸(logistic regression, LR)、隨機森林(randomforest, RF)。隨后,選擇篩選出的性能最佳的機器學(xué)習(xí)分類器,進行MRI、MG 影像組學(xué)模型構(gòu)建,最終將三組模型結(jié)果轉(zhuǎn)換為影像組學(xué)評分(radiomics score, Rad-score)。繪制多模態(tài)影像組學(xué)模型、MRI 影像組學(xué)模型、MG 影像組學(xué)模型受試者工作特征(receiver operating characteristic, ROC)曲線,比較三組影像組學(xué)模型的曲線下面積(area under the curve, AUC),得到最佳的影像組學(xué)模型。
對評價的臨床及影像指標(biāo)進行單因素分析,將篩選出的單因素指標(biāo)納入到多因素logistic 回歸分析,選擇多因素分析后P<0.05的指標(biāo)構(gòu)建臨床模型;最終,基于臨床危險因素和最佳組學(xué)模型的Rad-score建立列線圖模型并將模型可視化。
統(tǒng)計學(xué)分析采用SPSS 26.0、Medcalc 19.1.3 及R 4.3.2 軟件進行分析。符合正態(tài)分布的計量資料,使用獨立樣本t檢驗進行比較;不符合正態(tài)分布的計量資料用中位數(shù)(上四分位數(shù),下四分位數(shù))表示,采用Mann-WhitneyU檢驗分析。計數(shù)資料用頻數(shù)表示,使用卡方檢驗、連續(xù)性修正檢驗及Fisher確切概率法進行比較。通過單-多因素logistic回歸篩選臨床及影像特征指標(biāo)。使用ICC描述ROI勾畫結(jié)果的一致性,ICC>0.75表示一致性較好。采用Medcalc 19.1.3軟件繪制ROC 曲線,并計算AUC、敏感度和特異度評價不同模型的預(yù)測性能。使用R 4.3.2 軟件構(gòu)建列線圖模型,校準曲線和決策曲線(decision curve analysis,DCA)。P<0.05表示差異有統(tǒng)計學(xué)意義。
本研究共納入224 例患者,根據(jù)7∶3 比例將樣本隨機分為訓(xùn)練集156 例和測試集68 例,其中訓(xùn)練集ALN 陰性患者81 例、陽性患者75 例,測試集ALN 陰性患者36 例、陽性患者32 例。經(jīng)過統(tǒng)計學(xué)分析訓(xùn)練集與測試集所有納入的臨床及影像特征分布差異均無統(tǒng)計學(xué)意義(P<0.05)(表1)。
表1 訓(xùn)練集與測試集臨床及影像特征分布比較Tab.1 Comparison of the distribution of clinical and imaging features between the training set and the test set
以病理為ALN 狀態(tài)的金標(biāo)準,分析21 個臨床及影像資料。根據(jù)Youden 指數(shù)計算NLR、PLR 最佳臨界值分別為1.81、208.72。最終訓(xùn)練集分別篩選出臨床因素(臨床T 分期、淋巴結(jié)觸診、PLR),MRI 因素(病灶最大徑、形態(tài)、強化類型、BPE、BI-RADS 分類、MRI_ALN),MG 因素(BI-RADS 分類、MG_ALN)共11 個差異有統(tǒng)計學(xué)意義的危險因素(P<0.05)。測試集臨床因素(臨床T 分期、淋巴結(jié)觸診),MRI 因素(病灶最大徑、TIC、強化類型、BI-RADS 分類、MRI_ALN),MG因素(鈣化、MG_ALN)共9個差異有統(tǒng)計學(xué)意義的危險因素(P<0.05)(表2~3)。選取訓(xùn)練集及測試集共同的7 個獨立危險因素進行多因素logistic回歸分析。考慮到獨立危險因素較多,變量間可能存在嚴重多重共線性問題,導(dǎo)致模型方程不穩(wěn)定,進行多重共線性診斷,結(jié)果顯示每個因素的方差膨脹因子(variance inflation factor, VIF)均小于10,各因素之間不存在嚴重共線性問題,因此不需要采取特殊措施進行處理。經(jīng)多因素logistic回歸分析后,最終篩選出淋巴結(jié)觸診(P<0.001)及MRI_ALN(P=0.005)2 個獨立危險因素構(gòu)建臨床模型(表4)。
表2 訓(xùn)練集與測試集與ALN狀態(tài)相關(guān)的臨床因素Tab.2 Clinical factors related to ALN status between the training set and the test set
表3 訓(xùn)練集與測試集與ALN狀態(tài)相關(guān)的影像特征Tab.3 Imaging features related to axillary lymph node status between the training set and the test set
表4 訓(xùn)練集多因素logistic回歸分析Tab.4 Multivariate logistic regression analysis of the training group
多模態(tài)影像組學(xué)提取4500 個特征,經(jīng)方差分析后保留1530 個影像組學(xué)特征,再通過最優(yōu)超參數(shù)篩選獲得主要特征,基于上述主要特征構(gòu)建5種機器學(xué)習(xí)分類器用于評估乳腺癌患者ALN 狀態(tài)。結(jié)果顯示,在訓(xùn)練集中5 種機器學(xué)習(xí)分類器AUC 的范圍在0.889~0.993 之間,在測試集中5 種機器學(xué)習(xí)分類器的AUC 值范圍在0.764~0.864 之間,其中SVM 訓(xùn)練集與測試集的AUC值差異最小,并且SVM 的測試集(AUC=0.864)最高,因此選擇SVM 構(gòu)建多模態(tài)最佳影像組學(xué)模型,并作為構(gòu)建MRI及MG影像組學(xué)模型的機器學(xué)習(xí)分類器。最終SVM篩選出14個與ALN相關(guān)性最大的特征(圖2)。MRI影像組學(xué)及MG影像組學(xué)分別提取2250、2250個特征,經(jīng)最大最小值歸一化及方差分析后分別保留428、855個影像組學(xué)特征,再通過最優(yōu)超參數(shù)篩選及SVM分類器最終分別篩選出12、14 個影像組學(xué)特征,構(gòu)建MRI 及MG 影像組學(xué)模型。不同機器學(xué)習(xí)分類器在訓(xùn)練集和測試集中的AUC、敏感度、特異度和準確度(表5)。
表5 不同機器學(xué)習(xí)分類器在訓(xùn)練集和測試集的預(yù)測效能Tab.5 Prediction performance of different machine learning classifiers in the training set and the test set
圖2 多模態(tài)影像組學(xué)模型中SVM篩選的14個與腋窩淋巴結(jié)狀態(tài)相關(guān)性最大的影像組學(xué)特征。橫軸為每個特征對應(yīng)的權(quán)重系數(shù),縱軸為篩選出與腋窩淋巴結(jié)狀態(tài)相關(guān)的每個影像組學(xué)特征名稱。SVM:支持向量機;WAVELET:小波變換;LBP:局部二值模式;GRADIENT:梯度變換;LOG:拉普拉斯變換;EXPONENTIAL:指數(shù)變換;FIRSTORDER:一階紋理特征;NGTDM:鄰域灰度差矩陣;GLDM:灰度依賴矩陣;GLCM:灰度共生矩陣;GLSZM:灰度區(qū)域大小矩陣。Fig.2 The 14 radiomics features that were most correlated with axillary lymph node status were screened by SVM in the multimodal radiomics model.The horizontal axis is the weight coefficient corresponding to each feature, and the vertical axis is the name of each radiomics feature related to the status of axillary lymph nodes screened out.SVM: support vector machine; WAVELET: wavelet transform; LBP: local binary pattern;GRADIENT: gradient transform; LOG: laplace transform; EXPONENTIAL:exponential transformation; FIRSTORDER: first-order texture features;NGTDM: neighbouring gray tone difference matrix; GLDM: gray level dependence matrix; GLCM: gray level co-occurrence matrix; GLSZM: gray level size zone matrix.
分別繪制MRI、MG、多模態(tài)影像組學(xué)模型ROC曲線(圖3),比較三個模型的AUC 值,結(jié)果顯示多模態(tài)影像組學(xué)模型最高(訓(xùn)練集AUC:0.899;測試集AUC:0.864)。最終選擇多模態(tài)影像組學(xué)模型的Rad-score 聯(lián)合臨床模型構(gòu)建列線圖模型,并將列線圖可視化。在訓(xùn)練集中,MG影像組學(xué)模型、MRI影像組學(xué)模型、多模態(tài)影像組學(xué)模型、臨床模型和列線圖模型的AUC 分別為0.821、0.832、0.899、0.837、0.941;在測試集中,MG 影像組學(xué)模型、MRI影像組學(xué)模型、多模態(tài)影像組學(xué)模型、臨床模型和列線圖模型的AUC分別為0.795、0.813、0.864、0.849、0.926(表6、圖4)。通過DeLong 檢驗得出,列線圖模型與三種影像組學(xué)模型及臨床模型之間差異具有統(tǒng)計學(xué)意義(P<0.05),列線圖模型診斷性能較好。校準曲線顯示列線圖模型的實際曲線與理論曲線接近,表示一致性較好(圖5),決策曲線顯示列線圖模型在臨床受益方面整體優(yōu)于三種影像組學(xué)模型和臨床模型(圖6)。
表6 五種模型的預(yù)測效能Tab.6 Predictive performance of five models
圖3 五種模型的預(yù)測效能。3A:訓(xùn)練集五個模型ROC 曲線;3B:測試集五個模型ROC曲線。ROC:受試者工作特征;AUC:曲線下面積。Fig.3 Prediction performance of five model.3A: ROC curves of five models in the training set; 3B: ROC curves of five models in the test set.ROC: receiver operating characteristic; AUC: area under the curve.
圖4 多模態(tài)影像組學(xué)評分及臨床特征構(gòu)建的諾莫圖。Palpation:觸診(0=陰性,1=陽性);MRI_ALN:MRI腋窩淋巴結(jié)狀態(tài)(0=陰性,1=陽性);根據(jù)不同指標(biāo)對應(yīng)的分數(shù)計算腋窩淋巴結(jié)轉(zhuǎn)移的概率。Fig.4 Nomogram constructed by multimodal Rad-score and clinical features.Palpation: palpation (0=negative, 1=positive); MRI_ALN: MRI axillary lymph node status (0=negative, 1=positive).The probability of axillary lymph node metastasis is calculated according to the scores corresponding to different indicators.
圖5 訓(xùn)練集(5A)及測試集(5B)的校準曲線。橫坐標(biāo)為預(yù)測概率,縱坐標(biāo)為實際發(fā)生概率;當(dāng)實際曲線與理論曲線接近時,表示模型的校準效果好。Fig.5 Calibration curves of the training set (5A) and the test set (5B).The abscissa is the predicted probability, and the ordinate is the actual occurrence probability.When the actual curve is close to the the oretical curve, it means that the calibration effect of the model is good.
圖6 訓(xùn)練集(6A)及測試集(6B)的決策曲線。Fig.6 Decision curves for the training set (6A) and the test set (6B).
本研究選擇IDC 為研究對象,開發(fā)并驗證了一種基于多種機器學(xué)習(xí)的多模態(tài)影像組學(xué)模型聯(lián)合臨床高危因素的列線圖模型,探究其對評估ALN狀態(tài)的臨床價值。研究結(jié)果表明SVM對乳腺癌ALN轉(zhuǎn)移情況的預(yù)測優(yōu)于其他機器學(xué)習(xí)分類器,列線圖模型訓(xùn)練集及測試集的AUC 值分別為0.941、0.926,具有較高的診斷性能。本研究創(chuàng)新性地將MRI 與MG 聯(lián)合起來,可以充分提取病灶的影像特征,構(gòu)建出優(yōu)于單一模態(tài)的影像組學(xué)模型,為安全無創(chuàng)地預(yù)測ALN狀態(tài)提供可靠的支持,可輔助臨床制訂科學(xué)的診療方案。
乳腺癌是一種高度異質(zhì)性的腫瘤,影像組學(xué)能在一定程度上充分利用醫(yī)學(xué)成像的潛力來反映組織異質(zhì)性,進行乳腺癌ALN 轉(zhuǎn)移的術(shù)前評估[12-13],在眾多機器學(xué)習(xí)算法中,不同算法對預(yù)測乳腺癌ALN 的性能是不同的。本研究選擇5 種機器學(xué)習(xí)分類器進行乳腺癌ALN 狀態(tài)預(yù)測,研究結(jié)果表明SVM 的訓(xùn)練集與測試集AUC 值為0.899、0.864,其預(yù)測效果優(yōu)于其他機器學(xué)習(xí)分類器。CUI 等[14]選擇三種機器學(xué)習(xí)算法預(yù)測ALN 狀態(tài),結(jié)果表明SVM 分類器對乳腺癌ALN 的預(yù)測效果顯著高于KNN 分類器和線性判別算法(linear discriminant analysis, LDA),與本研究結(jié)果一致。YAO 等[15]使用4 種機器學(xué)習(xí)分類器構(gòu)建預(yù)測SLN轉(zhuǎn)移的影像組學(xué)模型,結(jié)果顯示SVM 的AUC值最高,由此可見SVM 分類器在二元分類問題中應(yīng)用較為廣泛。本研究五種機器學(xué)習(xí)分類器中LR 在二元分類問題中應(yīng)用也較為常見,但是其結(jié)果略低于SVM。KNN 結(jié)果最差,原因可能是KNN 是一種基于實例的學(xué)習(xí)方法,更加適用于具有相似特征的數(shù)據(jù)。SVM 算法不僅可以提高模型的魯棒性和泛化性[16],還可以通過核函數(shù)將數(shù)據(jù)映射到高維空間,解決非線性的分類問題[17-18],進而構(gòu)建出性能較好的模型,協(xié)助臨床評估ALN狀態(tài)指導(dǎo)后續(xù)治療。
本研究的MRI 影像組學(xué)模型診斷效能高于MAO 等[19]構(gòu)建的基于DCE-MRI 預(yù)測ALN 狀態(tài)的影像組學(xué)模型(訓(xùn)練集、測試集AUC 值分別為0.78、0.79),這可能是因為本研究加入T2WI 序列的原因,由于惡性腫瘤易出現(xiàn)囊變壞死,因此病灶內(nèi)部及周圍含水成分在T2WI 序列上更易觀察。TAN 等[20]采用SVM 分類器在脂肪抑制T2WI序列中提取23個影像組學(xué)特征構(gòu)建影像組學(xué)模型(訓(xùn)練集、測試集AUC值分別為0.880、0.819),雖然該模型訓(xùn)練集結(jié)果高于本研究的MRI 影像組學(xué)模型,但是明顯低于本研究的多模態(tài)影像組學(xué)模型,這表明了MRI 與MG 的結(jié)合可以相互彌補各自的不足,提升影像組學(xué)模型的診斷性能。DONG等[21]首次使用基于脂肪抑制T2WI序列和DWI 序列的影像組學(xué)預(yù)測患者的ALN 狀態(tài),研究結(jié)果表明聯(lián)合模型的預(yù)測性能(AUC 為0.805)優(yōu)于單獨使用脂肪抑制T2WI 和DWI 的預(yù)測性能(AUC 分別為0.770 和0.787)。ZHAO 等[22]證實了基于MRI 和MG 聯(lián)合建立的鑒別乳腺良惡性的影像組學(xué)模型比單一模型具有更好的診斷準確性,訓(xùn)練集和測試集的準確率分別達到89.6%和83.3%。這些都表明了不同的檢查手段可以揭示病灶不同的潛在信息,MG對鈣化的敏感度較高,DCE-MRI可以評估血管生成,反映腫瘤內(nèi)部的血流情況[23],T2WI序列更易觀察囊變壞死的異常信號。因此多模態(tài)組學(xué)模型可以提高診斷的準確性,可以指導(dǎo)臨床治療方案的制訂。
本研究通過SVM 構(gòu)建的多模態(tài)影像組學(xué)診斷模型最終共提取14 個特征,這些特征均是通過對原始圖像進行小波、指數(shù)、梯度等濾波器處理后,在衍生圖像上進行計算得出的,其中包括7個小波相關(guān)特征,經(jīng)小波變換后的紋理特征可以提供更有價值的腫瘤微環(huán)境信息,其細節(jié)和復(fù)雜度高于原始圖像[24]。MG CC 位圖像中提取的wavelet-HH-ngtdm-Contrast占比最大,與ALN 是否轉(zhuǎn)移呈負相關(guān)。相鄰灰度差異矩陣量化了圖像強度的總體變化,提供了整個圖像上相鄰像素之間的對比度量[25]。此外,T2WI 圖像上的一階特征占比較大,一階統(tǒng)計特征用于反映腫瘤內(nèi)灰度強分布,判斷腫瘤的異質(zhì)性,其值越大代表腫瘤生物學(xué)行為越活躍,轉(zhuǎn)移惡化的度的風(fēng)險越高[26]。DCE-MRI圖像中提取的經(jīng)過小波變換后的二階紋理特征wavelet-HH-glcm-Correlation 占比也較大,灰度共生矩陣可以通過相鄰方向、變化間隔和變化幅度的綜合圖像表現(xiàn)出腫瘤紋理信息[27]。ZHOU等[28]構(gòu)建的基于灰度超聲的影像組學(xué)模型得出wavet- LH-glcm-Correlation 與ALN 轉(zhuǎn)移的相關(guān)性最強,本研究也得出此特征與ALN 轉(zhuǎn)移顯著相關(guān)。既往研究表明,這些影像組學(xué)特征代表了灰度和紋理特征的細微差異,適用于評估腫瘤內(nèi)部異質(zhì)性,而腫瘤內(nèi)部異質(zhì)性與腫瘤進展和轉(zhuǎn)移行為有關(guān)[29-30]。
MAKSIMOVIC 等[9]分析了觸診、超聲和MRI 在乳腺癌患者ALN分期中的價值,研究結(jié)果顯示觸診的假陽性率為53%,假陰性率為36%,乳腺MRI 預(yù)測ALN轉(zhuǎn)移假陰性率為18%,由此可見單獨的觸診或乳腺MRI預(yù)測ALN轉(zhuǎn)移效果較差。本研究臨床及影像因素經(jīng)過單-多因素邏輯回歸分析后得出淋巴結(jié)觸診、MRI_ALN與ALN轉(zhuǎn)移具有相關(guān)性,臨床模型的AUC值為0.837、0.849,具有很好的預(yù)測價值,與朱蕓等[31]基于MRI、MG和病理的列線圖預(yù)測SLN狀態(tài)篩選出的臨床指標(biāo)一致。腫瘤進展是腫瘤細胞與健康細胞相互作用的復(fù)雜過程。中性粒細胞促進循環(huán)腫瘤細胞與遠處部位的黏附并誘導(dǎo)腫瘤生長[32]。血小板通過促進腫瘤細胞與內(nèi)皮的黏附,防止細胞死亡和遠處轉(zhuǎn)移,在癌癥進展中發(fā)揮作用[33]。MORKAVUK 等[34]報道,PLR對早期乳腺癌轉(zhuǎn)移性SLN 的診斷成功率高于超聲等影像學(xué)方法。本研究臨床因素加入了PLR及NLR進行分析,多因素分析結(jié)果顯示與ALN狀態(tài)沒有顯著差異。MA等[35]研究炎癥標(biāo)志物對新輔助化療患者的遠期生存率的預(yù)測價值,多因素分析顯示淋巴細胞-單核細胞比值和ALN 轉(zhuǎn)移是獨立預(yù)測因素,而NLR 和PLR與疾病預(yù)后沒有顯著相關(guān)性。上述研究結(jié)果的差異可能是截斷值不同造成的,由此可見炎性指標(biāo)是否是預(yù)測乳腺癌預(yù)后的有效指標(biāo)尚存在很大爭議,還有待后續(xù)的研究加以論證支撐。
本研究具有以下局限性:(1)本研究為單中心研究缺乏外部驗證,并且樣本量較小,可能導(dǎo)致結(jié)果穩(wěn)定性及可復(fù)現(xiàn)性差;(2)ROI 勾畫均為2D 勾畫,缺乏病灶的三維特征信息,未來會選擇進行3D 勾畫,并進行比較;(3)本研究忽略了瘤周區(qū)域可能存在的一些重要的生物學(xué)信息。
綜上所述,本研究基于多模態(tài)影像組學(xué)特征及臨床特征構(gòu)建的列線圖模型能夠在術(shù)前有效預(yù)測ALN狀態(tài),有望為臨床治療方案的制訂提供科學(xué)指導(dǎo)。
作者利益沖突聲明:全體作者均聲明無利益沖突。
作者貢獻聲明:謝宗玉設(shè)計本研究的方案,對稿件重要內(nèi)容進行了修改;張舒妮起草和撰寫稿件,獲取、分析及解釋本研究的數(shù)據(jù),對稿件重要內(nèi)容進行了修改;朱蕓、趙楠楠、李陽分析或解釋本研究的數(shù)據(jù),對稿件重要內(nèi)容進行了修改;楊靜茹、張澳淇、顧一泓完成數(shù)據(jù)前期收集與整合,對稿件重要內(nèi)容進行了修改;朱蕓獲得安徽省教育廳自然科學(xué)基金重點項目資助;張舒妮獲得蚌埠醫(yī)學(xué)院校級課題資助。全體作者都同意發(fā)表最后的修改稿,同意對本研究的所有方面負責(zé),確保本研究的準確性和誠信。