劉 敏,周 倩,吳雅蔚,臧 秀,費孝靜,侯錦路,葉德華
1. 盱眙縣人民醫(yī)院影像科,江蘇 淮安 223000;
2. 無錫市錫山人民醫(yī)院鵝湖分院消化內(nèi)科,江蘇 無錫 214000;
3. 鹽城市第一人民醫(yī)院影像科,江蘇 鹽城 224000
胰腺癌是常見的腹部腫瘤,惡性程度極高,5年生存率僅約7%[1]。既往文獻[2]報告,準確評估胰腺癌的惡性程度,對于手術(shù)切除前評估和改善生存率及預(yù)后有積極的作用。腫瘤的惡性程度與腫瘤細胞的分化程度息息相關(guān)。因此,術(shù)前準確地預(yù)測胰腺癌分化程度對于胰腺癌患者的腫瘤惡性程度評估及腫瘤分期、治療、預(yù)后都至關(guān)重要。計算機體層成像(computed tomography,CT)是術(shù)前評估胰腺癌患者首選的影像學(xué)方法[3-5],但CT檢查有其局限性,無法對胰腺癌的分化程度進行判定。因此,需要更智能、更敏感的診斷技術(shù),以期實現(xiàn)術(shù)前判定胰腺癌分化程度。近年來,基于大數(shù)據(jù)的影像組學(xué)研究已成為一個蓬勃發(fā)展的研究方向[6-9]?,F(xiàn)有的研究[10-11]結(jié)果表明,影像組學(xué)在預(yù)測胰腺癌良惡性方面具有一定的可行性。沈力等[12]建立了一個術(shù)前評估胰腺癌惡性程度的預(yù)測模型,成功地在不同分化程度的胰腺癌中實現(xiàn)惡性程度的評估,但是并沒有結(jié)合經(jīng)典的臨床指標。因此,本研究對腫瘤標志物和影像組學(xué)進行結(jié)合和分析,嘗試建立并驗證一種用于術(shù)前個體化預(yù)測胰腺癌分化程度的臨床-影像組學(xué)模型,以輔助臨床決策。
回顧并分析2010年9月—2019年12月江蘇省盱眙縣人民醫(yī)院經(jīng)術(shù)后病理學(xué)檢查證實的胰腺癌患者資料。納入標準:① 經(jīng)術(shù)后病理學(xué)檢查證實為胰腺癌并伴有明確的病理學(xué)分級;② 術(shù)前接受腹部增強CT檢查,并有完整的CT增強掃描圖像;③ 完整的臨床資料。排除標準:① 患者術(shù)前曾接受放化療;② 患者有其他腫瘤性疾??;③ 圖像偽影大,不能達到分析標準。最終,共56例患者的臨床和CT資料納入分析,其中男性38例,女性18例,年齡45~78歲,平均年齡(61.5±10.3)歲。依據(jù)術(shù)后病理學(xué)檢查結(jié)果將患者分為高分化組(29例)和中低分化組(27例)。依據(jù)入組時間先后,分為訓(xùn)練組39例(70%)及驗證組17例(30%)。其中訓(xùn)練組高分化21例,中低分化18例;驗證組高分化8例,中低分化9例。
采集全部患者的血清標本,采用化學(xué)發(fā)光免疫法對其糖類抗原(carbohydrate antigen,CA)19-9等項目進行檢測。CA19-9正常范圍為0~30 U/mL,本實驗收集的患者CA19-9為(202.45±45.61)U/mL。
56例患者均在治療前進行了CT增強檢查。采用德國Siemens公司的SOMATOM Definition Flash 64排雙源CT機,掃描范圍自膈頂至盆腔。囑咐患者在CT增強掃描前8 h禁食,于掃描前飲用1 000 mL水。CT增強掃描采用的對比劑為碘海醇(1.5 mL/kg),于患者前臂靜脈采用高壓注射器以2.5~3.5 mL/s的速率團注,造影劑注射量為80~100 mL。分別于注射對比劑之后25~30和60~70 s采集動脈期和門靜脈期圖像。掃描參數(shù):管電壓120 kV,參考管電流250 mA,掃描層厚為5 mm,對掃描圖像行薄層1.25 mm重建,用于后續(xù)圖像處理。
在影像存儲與傳輸系統(tǒng)(picture archiving and communication system,PACS)工作站將門靜脈期CT圖像導(dǎo)出,并轉(zhuǎn)換成Bmp格式保存。將所有CT圖像重建像素為512×512的圖像矩陣。使用軟件MaZda對圖像進行紋理分析,使用軟件中的感興趣區(qū)(region of interest,ROI)編輯器沿病灶周圍手動勾勒ROI,通過調(diào)整使ROI覆蓋完整病灶,隨后計算出病變區(qū)的特征[13-14]。本實驗對采集的所有CT圖像灰階進行標準化設(shè)定,圖像灰階范圍在[μ-3δ,μ+3δ]中(μ為平均灰度值,δ為標準差)[15]。圖像定性評估由2名放射科醫(yī)師(均有5年以上影像學(xué)診斷工作經(jīng)驗)完成。若2名醫(yī)師圖像評估存在分歧,則與另一名高年資放射科醫(yī)師(有10年以上影像學(xué)診斷經(jīng)驗)討論后達成一致意見。
提取的特征分別為直方圖(histogram)、灰度共生矩陣(gray-level co-occurrence matrix,GLCM)、游程矩陣(run-length matrix,RLM)、絕對梯度(absolute gradient,GRA)、自回歸模型(auto-regressive model,ARM)和小波變換(wavelet transform,WT),共計6大類279個紋理特征(表1)。大量的組學(xué)特征將加大運算量,故本實驗采用軟件內(nèi)置的3種特征提取方法[交互信息提取(mutual information,MI)、Fisher系數(shù)提?。╢isher coefficient,F(xiàn)isher)和分類錯誤概率聯(lián)合平均相關(guān)系數(shù)提?。╟lassification error probability combined with average correlation coefficients,POE+ACC)]對特征進行篩選,3種提取方法分別提取10個最有意義的特征,共計30個特征。首先對30個特征進行整合,去除重復(fù)性特征。然后,因為不同變量之間存在多重復(fù)雜性,研究[16]證實變量間相關(guān)性過大(|r|>0.6)將影響模型的穩(wěn)定性,故本實驗刪去|r|>0.6的特征。
表1 采用3種特征提取方法所提取的重要特征
本研究以術(shù)后病理學(xué)檢查結(jié)果為金標準進行分級,采用SPSS 20.0統(tǒng)計軟件和R語言軟件對數(shù)據(jù)進行分析。使用基于R語言的軟件包用于進一步的統(tǒng)計學(xué)分析,分別為用于可視化的ggplot2和corrplot軟件包,以及用于受試者工作特征(receiver operating characteristic,ROC)曲線分析的pROC軟件包。對所得特征行正態(tài)性檢驗,符合正態(tài)分布采用組內(nèi)獨立樣本t檢驗,不符合正態(tài)分布采用Mann-WhitneyU檢驗,并對差異有統(tǒng)計學(xué)意義的特征進行ROC曲線分析。本研究數(shù)據(jù)以±s表示,P<0.05為差異有統(tǒng)計學(xué)意義。
應(yīng)用軟件自帶特征提取法共提取30個特征,并去除重復(fù)的特征,剩余合計23個特征(表1)。對剩余的23個組學(xué)特征進行相關(guān)性分析(圖1),將相關(guān)性|r|>0.6的特征刪去。最終獲得6個特征見表2。
圖1 23個重要的組學(xué)特征的自相關(guān)性和交叉相關(guān)性相關(guān)圖
正態(tài)性檢驗結(jié)果:S(3,0)lnvDfMom不遵循正態(tài)分布,其余均遵循正態(tài)分布。進一步統(tǒng)計分析發(fā)現(xiàn),兩組間Teta2和S(1,0)Entrop差異有統(tǒng)計學(xué)意義(P<0.05)。而兩組間S(3,0)lnvDfMom、S(2,0)SumAverage、S(1,1)SumAverage及GrMean差異均無統(tǒng)計學(xué)意義(P>0.05,表2)。
表2 胰腺癌惡性程度的組學(xué)特征比較
ROC曲線分析顯示(圖2),以S(1,0)Entropy=1 258.87為閾值時,其鑒別胰腺癌惡性程度的效能最優(yōu)(AUC為0.70,靈敏度為83.33%,特異度為61.90%)。而以Teta2=0.36為閾值時,AUC達到最大(AUC=0.68),靈敏度和特異度分別為83.33%和57.14%。聯(lián)合特征Teta2+S(1,0)Entropy時AUC為0.74,靈敏度83.33%,特異度71.43%。聯(lián)合腫瘤標志物CA19-9時AUC為0.82,其對應(yīng)的靈敏度和特異度分別為72.22%和85.71%。
圖2 鑒別胰腺癌分化程度的ROC曲線
在驗證組中,從訓(xùn)練隊列中篩選出的紋理特征[Teta2和S(1,0)Entropy]聯(lián)合CA19-9后,AUC為0.78,靈敏度為66.67%,特異度為80.95%。
本研究發(fā)現(xiàn)Teta2和S(1,0)Entropy在鑒別胰腺癌惡性程度方面顯示出一定的價值,且這兩個影像組學(xué)特征聯(lián)合可以獲得較單一特征更優(yōu)的鑒別能力。本實驗在此基礎(chǔ)上,還加入了胰腺癌的經(jīng)典血清學(xué)指標CA19-9,結(jié)果顯示影像組學(xué)+血清學(xué)指標的診斷模型具有更好的診斷效能。本研究結(jié)果表明,臨床-影像組學(xué)診斷模型有潛力作為術(shù)前預(yù)測胰腺癌分化程度的臨床工具。
本研究提取共計279個特征,采用多種方法對特征進行降維,最終發(fā)現(xiàn)特征Teta2和S(1,0)Entropy在兩組間差異有統(tǒng)計學(xué)意義。S(1,0)Entropy描述病灶內(nèi)的紊亂程度,代表腫瘤的異質(zhì)性。于浩鵬等[17]發(fā)現(xiàn)熵(GLCMEntropy_AllDirection_offset7_SD)在胰腺神經(jīng)內(nèi)分泌腫瘤的病理學(xué)分級中同樣差異有統(tǒng)計學(xué)意義,AUC為0.715。而Teta2則是一個來自自回歸模型的高階特征,可提供關(guān)于相鄰像素之間相對于其灰度值的局部交互的信息。張永嫦等[18]通過對乏血供胰腺神經(jīng)內(nèi)分泌腫瘤(pancreatic neuroendocrine neoplasm,pNEN)和胰腺導(dǎo)管腺癌(pancreatic ductal adenocarcinoma,PDAC)的CT圖像進行紋理分析,證實了紋理特征Teta2具有較高的診斷效能。上述文獻皆與本研究結(jié)論相一致。
本研究建立了一種用于術(shù)前個體化預(yù)測胰腺癌分化程度的臨床-影像組學(xué)模型,該模型由腫瘤指標(CA19-9)和影像組學(xué)特征構(gòu)成。既往基于影像組學(xué)或紋理分析對胰腺癌的分級研究已經(jīng)獲得了較為豐富的成果。Choi等[19]基于CT增強掃描采用紋理分析對pNEN進行分級鑒別,證明低球度、高偏度、低峰度等CT紋理特征在診斷2/3級pNEN時較常規(guī)的影像學(xué)指標更有診斷優(yōu)勢。D’Onofrio等[20]基于CT三圍紋理特征對pNEN進行分級鑒別診斷,結(jié)果表明峰度和熵這兩種特征可以大大提高對pNEN的鑒別準確度。上述研究均基于單純的影像學(xué)建立診斷模型,并未結(jié)合臨床指標。而本研究的臨床-影像組學(xué)模型嘗試實現(xiàn)對患者的個體化預(yù)測,這符合當(dāng)前個體化精準醫(yī)療的趨勢。
本實驗的挑戰(zhàn)之一是對大量冗雜可用特征進行篩選,事實上過多的特征不僅增加運算量還會增加獲取重要特征的難度。首先通過軟件自帶的3種降維方法挑選出30個重要特征,并去除重復(fù)的特征,剩余23個。文獻[21]報告不同特征之間存在多重復(fù)雜性,因此再進行共線性檢查去除|r|>0.6的高共線性特征。與傳統(tǒng)的單一降維方法相比,多步驟聯(lián)合的降維方法有更好的可視化效果,且創(chuàng)新性地將傳統(tǒng)降維方法與統(tǒng)計學(xué)方法結(jié)合,以得到更好的降維效果[22]。
本實驗存在一定的局限性:① 本研究由兩個相對較小的樣本量隊列組成。雖然影像組學(xué)的診斷性能是在一個相對獨立的隊列中被重復(fù),但本研究中所做的觀察需要在更大的樣本量的研究中被復(fù)制;② 不同的CT參數(shù)對組學(xué)特征的影響還有待進一步探索;③ 胰腺癌ROI的勾畫采用手動勾畫,后續(xù)研究將采取結(jié)合深度學(xué)習(xí)的方法實現(xiàn)自動化分割;④ 本研究結(jié)果來自于單一機構(gòu),因此需要多中心研究以明確模型的通用性。
綜上所述,本研究建立了一個聯(lián)合臨床經(jīng)典指標和影像組學(xué)特征的臨床-影像組學(xué)診斷模型,可作為術(shù)前個體化無創(chuàng)性預(yù)測胰腺癌惡性程度的臨床工具,有助于作出胰腺癌精準治療的決策。