趙瑩瑩,方陳,吳聲連,徐偉,鄭鵬翔,鄭偉龍,陳志強
作者單位:1.福建醫(yī)科大學附屬福清市醫(yī)院影像科,福州 350000;2.寧夏醫(yī)科大學總醫(yī)院放射科,銀川 750004;3.福建醫(yī)科大學附屬福清市醫(yī)院泌尿外科,福州 350000
前列腺癌(prostate cancer, PCa)是一種“老化的腫瘤”,約六分之一的男性一生中會罹患[1-2],并且發(fā)病較隱匿,早期發(fā)現(xiàn)和準確診斷可以提高患者生存率并降低治療成本。一項大樣本研究表明,在初次活檢前使用MRI進行分診可減少約四分之一的不必要活檢,并避免臨床上無意義病灶的過度診斷[3]。另一項研究表明,結合擴散加權成像(diffusion weighted imaging,DWI)和T2WI的雙參數MRI(biparametric MRI, Bp-MRI)可以提高腫瘤診斷及其侵襲性識別的能力[4]。然而,傳統(tǒng)的醫(yī)學影像學有不可避免的局限性,通過肉眼獲得的信息是有限的,只有少數特征被識別和描述,影響了診斷腫瘤良惡性和分期的準確性[4-5]。此外,醫(yī)學影像在很大程度上依賴于放射科醫(yī)生的知識和經驗,這導致了其高異質性和低重現(xiàn)性。
影像組學可從醫(yī)學影像中定量提取圖像特征,使用算法或統(tǒng)計分析工具捕獲腫瘤內不同區(qū)域之間的形態(tài)和功能的細微異質性,提供除主觀定性分析之外的大量信息,比傳統(tǒng)影像學更能準確地描述腫瘤[6]。目前,MRI 影像組學已廣泛應用于PCa 的診斷與鑒別、病理分級、侵襲性評估以及療效預測和預后分析的研究中[7-10]。但大多數研究[7-9]只關注了病變的影像組學特征,未能充分利用臨床指標的優(yōu)勢。因此,本文旨在探討基于T2WI 及DWI 的Bp-MRI 的影像組學結合臨床危險因素的聯(lián)合模型識別PCa 的診斷性能,并建立一個個體化PCa預測模型。
本研究經福建醫(yī)科大學附屬福清市醫(yī)院醫(yī)學倫理委員會批準,免除受試者知情同意,批準文號:K(2021)14 號?;仡櫺苑治?018 年6 月至2022 年1 月在福建醫(yī)科大學附屬福清市醫(yī)院行前列腺MRI 檢查的患者的臨床信息[包括年齡、總前列腺特異性抗原(total prostate specific antigen, tPSA)、游離前列腺特異抗原(free prostate specific antigen,fPSA)/tPSA 比值(f/t)等]及影像學資料。納入標準:(1)前列腺MRI 圖像上有明顯的病灶(病灶直徑≥0.5 cm);(2)經病理學證實,并與MRI 圖像匹配在同一區(qū)域;(3)超聲引導下前列腺穿刺或根治手術于MRI檢查后一個月內進行。排除標準:(1)MRI檢查前已經治療或穿刺;(2)多種原發(fā)性癌癥或既往有癌癥病史;(3)序列不完整或圖像質量不佳;(4)臨床資料不完整。
所有患者均使用Siemens Spectra 3.0 T磁共振掃描儀,以體線圈為射頻發(fā)射線圈,心臟相控陣線圈及脊柱線圈為接收線圈。T2WI 序列掃描參數如下:TE 72 ms,TR 4000 ms,矩陣128×128,F(xiàn)OV 360 mm×360 mm,層厚4 mm,層間距0.5 mm;DWI 序列掃描參數如下:TE 72 ms,TR 4100 ms,矩陣128×128,F(xiàn)OV 360 mm×360 mm,層厚4 mm 層間距0.5 mm,b 值為0、2000 s/mm2,激勵次數0、10。
由一名具有5 年腹部MRI 診斷經驗的影像醫(yī)師將入組患者的T2WI、DWI(b=2000 s/mm2)及ADC 原始圖像以醫(yī)學數字成像和通信(digital imaging and communications in medicine,DICOM)格式導出并傳入開源軟件ITK-SNAP 3.8,根據三維感興趣區(qū)法及詳細的病理結果逐層勾畫病灶區(qū),見圖1。然后使用Python 3.7.1 的影像組學包(PyRadiomics 3.0)提取了3111 個影像組學特征[每個序列各1037個特征,包括14個形狀特征(original_shape),198個一階直方圖特征,264 個灰度共生矩陣(gray level co-occurence matrix, GLCM)特征,154 個灰度相關矩陣(gray level dependence matrix, GLDM)特征,176 個灰度游程矩陣(graylevel run length matrix, GLRLM)特征,176 個灰度區(qū)域大小矩陣(gray level size zone matrix,GLSZM)特征,55個鄰域灰度差矩陣(neighbouring gray tone difference matrix, NGTDM)特征)]。由另1 名具有8年腹部MRI診斷經驗的影像醫(yī)師隨機抽取60例患者重復上述操作。以一致性相關系數(inter-class correlation coefficient, ICC)評價觀察者間提取影像組學特征的一致性,ICC>0.75 為一致性較好。
圖1 男,75 歲,病理診斷為前列腺癌。1A:病理圖(HE×100)示腺體融合、腺腔發(fā)育不全,并見篩狀腺體,Gleason評分為4+4;1B:T2WI 示外周帶5~7 點鐘方向T2WI 低信號結節(jié);1C:ITK-SNAP 軟件勾畫病灶區(qū)示意圖;1D:擴散加權成像(DWI)圖(b=2000 s/mm2),病灶呈明顯高信號;1E:表觀擴散系數(ADC)圖,病灶呈明顯低信號。Fig.1 Male, 75-year-old, pathologically diagnosed prostate cancer. 1A: The pathological image (HE ×100) showed glandular fusion,glandular agenesis,and sieve glands,Gleason score 4+4.1B:T2WI image showed low signal nodules at 5-7 o'clock; 1C: Schematic diagram of the focal area delineated by ITK-SNAP; 1D: The diffusion weighted imaging(DWI) image (b=2000 s/mm2), the lesion showed a significantly high signal; 1E: The apparent diffusion coefficient(ADC)image,the lesion showed a significantly low signal.
首先對所有的影像組學特征進行數據標準化,并對訓練集的數據進行一次上采樣,避免樣本不平衡。隨后,將一致性較差(ICC<0.75)的特征過濾掉,再采用t檢驗或Wilcoxon秩和檢驗篩選出惡性組與良性組間差異有統(tǒng)計學意義的變量;然后,采用最小絕對收縮和選擇算子(least absolute shrinkage and selection operator, LASSO)算法對非零系數的特征進行選擇;接著,用Spearman相關分析計算特征之間的相關系數,剔除高度相關(r>0.7)的特征來減少冗余數據;再采用單因素logistic回歸分析,選擇具有顯著性差異的特征(P<0.05);最后,采用多因素logistic 回歸分析,從剩余的特征中篩選出有價值的特征進行擬合,建立一個結合影像組學特征和臨床特征的聯(lián)合模型。
所有統(tǒng)計分析均在R 軟件(v.3.5.1)和Python 軟件(v.3.7.1)進行。計數資料行χ2檢驗,對計量參數進行方差齊性檢驗,如符合正態(tài)分布,行兩獨立樣本t檢驗,如不符合正態(tài)分布,則行非參數檢驗,P<0.05 表示差異有統(tǒng)計學意義。通過Spearman 相關分析來評估影像組學特征之間的相關性。采用logistic 回歸模型對篩選出的臨床及組學特征進行建模分析。采用受試者工作特征(receiver operating characteristic,ROC)曲線及曲線下面積(area under the curve, AUC)和校準曲線來評估模型的性能。
最終有161 名患者納入本研究,年齡50~87 歲,平均年齡70.3 歲。其中PCa 患者59 例[前列腺特異性抗原(prostate specific antigen, PSA)范圍3.2~100.0 ng/mL,平均PSA 水平為19.6 ng/mL],良性疾病患者102 例(PSA 范圍0.6~43.8 ng/mL,平均PSA 水平為5.7 ng/mL)。這些患者按照7∶3 的比例隨機、分層劃分為訓練組(n=113)和驗證組(n=48)。
首先剔除掉572個一致性差(ICC<0.75)的組學特征,然后使用兩獨立樣本t檢驗/Wilcoxon秩和檢驗篩選出兩組間存在顯著差異的1525個特征,用LASSO算法篩選出非零系數的9個特征并根據相應的特征系數計算出影像組學評分(Radscore)(具體參數信息見表1),再行Spearman相關分析發(fā)現(xiàn)有4個特征相關系數大于0.7,隨機剔除兩個特征:b2000.original_shape_Sphericity(b2000.OSS)、b2000.original_glszm_SmallAreaEmphasis(b2000.OGSAE),最終剩余7 個特征:T2WI.original_shape_LeastAxisLength(T2WI.OSLA)、T2WI.original_shape_Sphericity(T2WI.OSS)、b2000.exponential_firstorder_Minimum(b2000.EFM)、b2000.wavelet.LLH_glszm_GrayLevelNonUniformity(b2000.WLGGN)、ADC.square_gldm_DependenceVariance(ADC.SGDV)、ADC.wavelet.LHL_glcm_Idn(ADC.WLI)、ADC.wavelet.LLL_firstorder_Median(WLFM),相關性矩陣見圖2。影像組學模型在訓練隊列中AUC 為0.946(95%CI:0.903~0.982),在驗證隊列中AUC為0.902(95%CI:0.862~0.958),ROC曲線見圖3。采用單因素logistic回歸分析對臨床特征及影像組學特征進行選擇和驗證,選擇P<0.05 的變量,并計算各參數診斷PCa的診斷效能,見表1。然后,采用向后逐步logistic回歸分析篩選出tPSA、f/t和Radscore作為PCa的顯著預測因子并制作聯(lián)合列線圖(圖4),在訓練隊列中AUC 為0.965(95%CI:0.904~0.989),在驗證隊列中AUC 為0.924(95%CI:0.868~0.980),高級校準曲線如圖4 所示。并利用聯(lián)合列線圖計算出每個病例對應患PCa的概率及最佳截斷值,見表1。
圖2 7 個影像組學特征的相關性矩陣圖。OSS 為original_shape_Sphericity 特征;EFM 為exponential_firstorder_Minimum 特征;WLFM 為wavelet.LLL_firstorder_Median特征;OSLA為original_shape_LeastAxisLength特征;WLGGN為wavelet.LLH_glszm_GrayLevelNonUniformity特征;SGDV為square_gldm_DependenceVariance 特征;WLI 為wavelet.LHL_glcm_Idn 特征。 圖3 影像組學模型在訓練集和驗證集診斷前列腺癌(PCa)的受試者工作特征(ROC)曲線。 圖4 列線圖、校準曲線及決策曲線。4A:基于結合臨床危險因素總前列腺特異性抗原(tPSA)、fPSA/tPSA比值(fPSA為游離前列腺特異抗原)和影像組學評分Radscore的聯(lián)合模型的列線圖。4B、4C:訓練集、驗證集的校準曲線顯示,聯(lián)合模型在訓練集及驗證集中的校準度均較好,ROC 曲線下面積(AUC)分別為0.965、0.924。y 軸表示患者中PCa 的實際患病率;x 軸表示PCa的列線圖預測概率;灰色對角實線表示由完美模型擬合的理想模型。4D:訓練集中聯(lián)合模型、組學模型和臨床模型的決策曲線(DCA)顯示,閾值取0~0.9時,聯(lián)合模型在訓練集數據中的臨床凈獲益均大于臨床模型。y軸表示凈收益,x軸表示閾值概率。綠線表示聯(lián)合模型,紅線表示臨床模型,藍線表示組學模型,灰線表示所有患者均為PCa患者的假設。Fig.2 Correlation matrix plot of the 7 radiomics features.OSS:original_shape_Sphericity;EFM:exponential_firstorder_Minimum;WLFM:wavelet.LLL_firstorder_Median;OSLA: original_shape_LeastAxisLength ; WLGGN: wavelet.LLH_glszm_GrayLevelNonUniformity ; SGDV: square_gldm_DependenceVariance; WLI: wavelet.LHL_glcm_Idn. Fig. 3 Receiver operating characteristic (ROC) curves of prostate cancer diagnosis in the training set and validation set. Fig. 4 Nomogram,calibration curve and decision curve. 4A: Nomogram of the combined model based on combining clinical risk factors total prostate specific antigen (tPSA), free prostate specific antigen(fPSA)/tPSA(f/t)and Radscore.4B,4C:The calibration curves of the training set(4B)and the validation set(4C)show that the calibration of the joint model was good in both the training set and the validation set, with an area under the ROC curve of 0.965 and 0.924, respectively.The y-axis indicates the actual prevalence of prostate cancer (PCa) in patients; the x-axis represents the nomogram prediction probability of the PCa, and the gray diagonal solid line represents the ideal model fitted by a perfect model.4D:Decision curve(DCA)of the combined model,omics model and clinical model in the training set show that when the threshold is 0 to 0.9, the net clinical benefit of the combined model is greater than the clinical model. The y-axis represents the net gain, and the x-axis represents the threshold probability.Green lines indicate the combined model,red lines indicate the clinical model,blue lines indicate the radiomics model,and grey lines indicate the assumption that all patients were PCa patients.
表1 臨床特征及影像組學特征診斷前列腺癌的效能Tab.1 Efficacy of clinical characteristics and radiomics characteristics in the diagnosis of prostate cancer
本研究中我們從Bp-MRI 圖像中提取并篩選出7 個影像組學特征,結合臨床危險因素(tPSA、f/t),構建了PCa預測模型并對其進行驗證。結果顯示,在訓練隊列和驗證隊列中均有良好的性能,AUC 分別為0.965 和0.924,均優(yōu)于單獨的臨床模型或影像組學模型。這充分顯示了影像組學和臨床特征的互補性,影像組學在宏觀水平上捕獲腫瘤的表型,而腫瘤標志物(tPSA、f/t)可在微觀水平上提供詳細量化信息。
本研究結果顯示,tPSA 的表達水平及f/t 與PCa呈顯著相關,這與以往的研究一致[11-12]。PSA 是由前列腺上皮細胞分泌產生的絲氨酸蛋白酶和糖蛋白,并直接分泌到前列腺導管系統(tǒng),正常前列腺管系統(tǒng)周圍有一個血—上皮屏障,可阻止PSA直接從前列腺上皮進入血液,從而維持血液中PSA 的低濃度[13]。PCa 會破壞血—上皮屏障,導致血清PSA 濃度明顯增加,因此PSA 是早期篩查和檢測PCa 的關鍵腫瘤標志物,并廣泛應用于臨床,但其缺乏特異性。研究表明,在PCa 患者中絕大部分PSA 為結合狀態(tài),f/t 低于正常人或良性前列腺增生患者[14]。因此,臨床會利用f/t 來增加診斷信心,我們的結果顯示f/t 的最佳截斷值為0.16,這與Thakur 等[15]的報道一致。但僅基于這兩個因素構建的臨床模型的診斷性能較低。
影像組學是一門結合人工智能和醫(yī)學影像的綜合性學科,過去10 年在醫(yī)學圖像分析方面取得了巨大突破,可提取高通量特征,將醫(yī)學圖像數據轉化為定量和多維特征,反映人體組織在細胞和遺傳水平的變化,并提供更詳細的腫瘤生物學信息和腫瘤內部微環(huán)境的特征[16],從而直觀、定量地描述病變的形態(tài)和病理學特征。研究表明,影像組學在多種腫瘤中的表現(xiàn)優(yōu)于傳統(tǒng)的醫(yī)學影像[6,16]。特別是應用于前列腺MRI 時,基于形狀、紋理和強度特征的預測模型可以幫助PCa的診斷、分期及復發(fā)和侵襲性評估[9-10]。
在所有的影像組學特征中小波特征(wavelet)占比最大,這與之前的研究結果一致[17-18]。小波域的特征聚焦于不同的頻率范圍,將圖像分割成多層次的細節(jié)成分,能夠區(qū)分腫瘤微環(huán)境的差異,量化肉眼無法識別的腫瘤異質性[19-20]。具體來說,高頻特征反映了腫瘤的邊緣和細節(jié)信息,而低頻特征獲得了腫瘤的輪廓信息,同時對噪聲進行了過濾,因此具有較強的預測能力,是構建影像組學模型的重要組成部分[21-22]。其次為形狀特征,其旨在描述腫瘤的大小及三維形態(tài)等相關信息,本文中包括T2WI.OSLA、T2WI.OSS以及b2000.OSS的組學特征,表明瘤灶的形狀、體積是重要的預測特征,對PCa的鑒別具有重要意義,與Bai等[18]的結果一致。此外,我們還發(fā)現(xiàn)了一個與生物學特征相對應的代表圖像區(qū)域內體素強度分布的直方圖特征(b2000.EFM),此特征在PCa和良性病變之間的差異可能歸因于腫瘤內異質性(如血管生成、侵襲性等)[23]。
為了便于臨床應用,我們建立了一個可視化、可量化和個體化工具聯(lián)合列線圖模型,其結合了影像及臨床資料,更全面、準確地預測患PCa的概率,為臨床醫(yī)生進行癌癥管理提供有效的治療指導[20]。根據列線圖預測概率,可將患者分為PCa高風險患者和低風險患者。對于那些低風險的患者,不僅可以避免不必要的醫(yī)療檢查和過度治療,以減輕隨訪費用,還能有效預防低級別PCa的進展。近年來,在臨床醫(yī)學中得到了廣泛的應用,該模型表達清晰、簡潔、易于理解并利于醫(yī)患溝通。
本研究有幾個局限性。首先,沒有對PCa患者外周帶及中央腺體癌進行分類;其次,樣本量較?。蛔詈?,這是一項單中心回顧性研究。未來需要通過多中心研究、擴大樣本量并對癌灶位置進行分類,進行外部驗證來評估結果的普遍性。
作者利益沖突聲明:全部作者均聲明無利益沖突。