范海云, 陳基明, 陳亮亮, 吳敬醫(yī), 吳莉莉, 周慧
急性胰腺炎(acute pancreatitis,AP)是消化系統(tǒng)常見的急腹癥,其發(fā)病機制是因胰酶異常激活破壞腺泡細胞及其附近的腹膜,引起胰腺及其周圍組織水腫、積液、壞死及感染等病理改變,炎性胰液還可向胰腺外臟器組織內(nèi)擴散、浸潤,引起相應器官及系統(tǒng)功能障礙,促使局部及全身炎癥反應的發(fā)生[1-3]。如何早期準確預測病程的發(fā)展直接影響到患者預后。已有多種評分系統(tǒng)評價AP的不良結(jié)果,如急性生理與慢性健康評估(acute physiology and chronic headlthevaluation,APACHE-Ⅱ)、AP床旁嚴重度指數(shù)(bedside index for severity in acute pancreatitis,BISAP)及改良的CT嚴重度指數(shù)(meliorate computed tomography severity index,MCTSI)等,但效能都不高[4]。影像學預測胰腺疾病的進程和預后具有重要作用,影像學精確診斷是臨床精準治療的前提[5]。CT是評估AP嚴重程度及并發(fā)癥的主要方法[6],Lankisch等[7]認為胰周積液的存在程度與AP的不良結(jié)果顯著相關(guān),已有研究[8]證明胰腺外壞死體積能夠早期預測AP的嚴重程度,然而CT表現(xiàn)難以在AP的早期階段預測進展[9]。
影像組學是一種新興技術(shù),可從圖像中提取人類肉眼難以觀察及分辨的大量參數(shù),并通過多種算法將圖像數(shù)據(jù)轉(zhuǎn)化為高維和可挖掘的數(shù)據(jù),故能對疾病的異質(zhì)性進行全面量化分析[10-11]。目前有關(guān)急性胰腺炎的影像組學研究較少且都是基于胰腺實質(zhì)進行分析[12-13],能否基于胰周脂肪間隙影像組學分析早期預測AP疾病進展,尚未有相關(guān)研究報道。本研究基于CT平掃及增強圖像,通過納入臨床、影像學及紋理特征等多參數(shù),對胰周脂肪間隙進行影像組學分析,探究其預測早期AP疾病進展的價值。
采用回顧性病例對照研究方法。搜集皖南醫(yī)學院弋磯山醫(yī)院2013年11月-2021年6月123例根據(jù)新修訂的亞特蘭大分類診斷為AP患者的臨床及影像學資料。納入標準:①首次發(fā)病入院;②早期階段(發(fā)病1周內(nèi)[14-15])接受CT平掃及增強檢查;③所有患者均進行2次CT檢查。排除標準:①圖像不全或質(zhì)量不佳影響觀測;②自身免疫性胰腺炎、胰腺腫瘤或創(chuàng)傷;③難以勾畫胰周脂肪間隙的ROI。根據(jù)影像學及臨床實驗室等指標是否出現(xiàn)新的并發(fā)癥(包括局部并發(fā)癥:11例急性胰腺周圍積液、2例急性壞死性積聚、6例胰腺假性囊腫、2例包裹性壞死、1例感染性胰腺壞死、2例靜脈血栓、1例假性動脈瘤;全身并發(fā)癥:4例全身炎癥反應綜合征、2例器官功能衰竭)及局部并發(fā)癥的加重(7例急性胰腺周圍積液增多、1例急性壞死性積聚范圍增大),將AP患者分為進展組(n=39)與非進展組(n=84)。采用計算機完全隨機方法將患者按7:3的比例分為訓練組87例(進展組28例,非進展組59例)和驗證組36例(進展組11例,非進展組25例)。
搜集患者的臨床資料及實驗室檢查數(shù)據(jù),包括性別、年齡、病因、癥狀、體征、淀粉酶、脂肪酶、血鈣、尿素氮、肌酐值,使用急性胰腺炎BISAP對患者進行評分,BISAP評分標準包括 ①血尿素氮;②意識障礙;③SIRS;④年齡;⑤胸腔積液。
采用飛利浦64排螺旋CT機對AP患者進行上腹部或全腹部MSCT平掃及增強掃描,患者取仰臥位,圖像采集參數(shù):管電壓為120 kV,管電流為220 mA,層厚5 mm,層間5 mm,DFOV為30 cm×30 cm。使用碘克沙醇100 mL:32 g(Ⅰ)對比劑,經(jīng)右肘前靜脈注射對比劑1.5 mL/kg,注射流率2.5 mL/s,分別于注射后動脈期25 s、靜脈期40~65 s和延遲期3 min采集圖像。
由2名診斷醫(yī)師(具有5年和15年工作經(jīng)驗)盲法分析CT檢查圖像,評價AP的影像特征包括胰腺大小、類型(根據(jù)病變累及胰腺范圍分為彌漫性與局限性)、邊緣、胰周脂肪間隙密度及強化程度等,并進行改良的MCTSI評分,意見不一致時,由兩名醫(yī)生討論后決定。于增強靜脈期測量腫大胰腺最大前后徑,分別在平掃、動脈期、靜脈期和延遲期放置感興趣區(qū)(region of interest,ROI)測量炎癥胰腺前方(距胰腺前緣3~5 mm范圍)的脂肪間隙密度,并計算動脈期、靜脈期和延遲期強化率,所有ROI形狀、大小相同,均測量3次,計算其平均值。
圖1 CT靜脈期圖像,用ITK-SNAP軟件手動勾畫距炎癥胰腺前緣3~5mm范圍內(nèi)的單層脂肪間隙的閉合ROI。
將所有患者的CT平掃、動脈、靜脈及延遲期圖像從PACS系統(tǒng)工作站以DICOM格式導出,再依次導入ITK-SNP軟件(3.6.0版本),窗寬、窗位調(diào)整為(350、50),由2名放射科醫(yī)師(具有5年和15年以上工作經(jīng)驗)對各期通過人工手動分割的方法勾畫距炎癥胰腺前緣3~5 mm范圍的單層脂肪間隙(圖1),再分別將勾畫出圖像轉(zhuǎn)入AK(GE Healthcare Analysis Kit,3.2.0版)軟件中,通過提取影像組學特征及濾波變換獲取圖像信息(包括一階特征、形態(tài)特征、灰度共生矩陣特征、灰度區(qū)域大小矩陣特征、灰度游程矩陣特征、鄰域灰度差矩陣特征、灰度依賴矩陣特征以及拉普拉斯-高斯濾波、小波分析、局部二值模式變換)。通過組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC)評價2名醫(yī)師提取紋理特征的一致性,并保留一致性較好(ICC>0.80)的特征,依次使用最小冗余最大相關(guān)(minimum redundancy maximum relevance,mRMR)和最小絕對值收斂和選擇算子(least absolute shrinkage and selection operator,LASSO)回歸對保留的特征進行降維、篩選,獲取最佳特征子集。以此分別構(gòu)建各期影像的組學標簽,通過計算各個特征權(quán)重得出每個患者的標簽得分(Rad-score)。
使用SPSS24.0軟件、R軟件(版本4.0.4)和MedCalc軟件(Version19.0.2)進行統(tǒng)計分析。采用Kolmogorov-Smirnov檢驗對計量資料進行正態(tài)性檢驗,符合正態(tài)分布者以均數(shù)±標準差表示,偏態(tài)分布者以中位數(shù)表示。計量資料組間比較采用獨立樣本t檢驗(正態(tài)分布且方差齊性),Mann-WhineyU檢驗(偏態(tài)分布或方差不齊);計數(shù)資料組間比較采用χ2檢驗或Fisher檢驗。采用ICC評價提取紋理特征的一致性。利用mRMR選擇紋理特征,然后經(jīng)LASSO回歸進一步篩選紋理特征并構(gòu)建影像組學標簽,根據(jù)特征權(quán)重計算每個患者的Rad-score;通過100次留組交叉驗證(leave-group-out cross validation,LGOCV)評判模型的可靠性。采用多因素logistic回歸分析,并使用方差膨脹因子(variance inflation factor,VIF)進行共線性檢查,構(gòu)建預測模型,繪制校正曲線來評價模型的擬合優(yōu)度,并使用Hosmer-Lemeshow檢驗評價校準曲線的一致性,計算受試者工作特征(receiver operating characteristic,ROC)曲線下面積(area under curve,AUC),通過DeLong檢驗比較多個模型間AUC,繪制決策曲線分析(decision curve analysis,DCA)比較模型的臨床凈收益。P<0.05表示差異有統(tǒng)計學意義。
在訓練組和驗證組中,進展組與非進展組患者間血鈣、邊緣差異均有統(tǒng)計學意義,其余臨床及CT特征變量差異均無統(tǒng)計學意義(表1)。經(jīng)共線性檢查將訓練組P<0.05的變量納入多因素logistic回歸分析建立包括臨床資料及CT特征的臨床模型,臨床模型得分=4.078-2.464×血鈣+1.749×邊緣。結(jié)果顯示血鈣和邊緣(OR=0.085,P=0.040和OR=5.750,P=0.020)是獨立預測因子。繪制ROC曲線,結(jié)果顯示臨床模型在訓練組和驗證組中AUC分別為0.70、0.83(表2、圖2)。
表1 進展組和非進展組患者在訓練組和驗證組中的臨床和CT特征
表2 臨床模型、影像組學標簽及影像組學預測模型ROC結(jié)果
圖2 各預測模型ROC曲線。a)訓練組;b)驗證組。 圖3 采用 LASSO 進行特征篩選。a) 聯(lián)合序列訓練組中使用 LASSO 方法對紋理特征進行降維,左側(cè)垂直虛線代表最佳Lambda值對應的Log(Lambda)值,選取標準為最小化標準,圖片頂端數(shù)值為特征數(shù); b) 聯(lián)合序列訓練組中不同紋理特征在LASSO收斂系數(shù)圖,虛線為使十倍交叉運算的Lambda值繪制,每條曲線代表每一個自變量的變化軌跡,圖中顯示了14個非零系數(shù)的紋理特征。
2名醫(yī)師測量組間ICC為0.831(95%CI:0.716~0.925,P<0.05),ICC>0.80說明特征提取的一致性較好,選取高年資醫(yī)師提取的特征進行影像組學分析。
AK軟件從平掃、動脈、靜脈及延遲期每個序列圖像經(jīng)紋理提取和濾波變換后各獲得1316個紋理特征,共于4個序列提取5264個紋理特征,經(jīng)mRMR 去除冗余特征,再經(jīng)LASSO回歸篩選最優(yōu)超參數(shù)λ(圖3a)以及在此時λ系數(shù)不為0的特征(圖3b),于平掃、動脈期、靜脈、延遲期及聯(lián)合序列中分別得到15、12、7、14、14個價值較大的紋理特征(圖4),再分別建立影像組學標簽,根據(jù)各期特征的權(quán)重計算出每個患者的影像組學標簽得分。100次LGOCV顯示單獨序列和4期聯(lián)合序列模型均有良好的穩(wěn)定性。經(jīng)ROC曲線分析,平掃序列與聯(lián)合序列影像組學標簽均有相對更好的預測效能。AUC在訓練組中均為0.94,在驗證組中分別為0.95、0.96(表2),經(jīng)DeLong檢驗各序列影像組學標簽間差異均無統(tǒng)計學意義(P>0.05),平掃序列及聯(lián)合序列影像組學標簽與臨床模型間差異有統(tǒng)計學意義(Z=3.739、3.298,P<0.001、P=0.001)。
圖4 聯(lián)合序列影像組學標簽的紋理特征及權(quán)重。
圖5 聯(lián)合序列個性化模型的校正曲線。a) 訓練組;b) 驗證組。
平掃和聯(lián)合序列影像組學標簽預測效能相對較高,本研究將平掃和聯(lián)合序列影像組學標簽分別與臨床資料及CT特征通過多因素Logistic回歸分析建立個性化預測模型。建立的平掃序列個性化模型預測效能較高,但校正曲線經(jīng)Hosmer-Lemeshow檢驗擬合效果較差(訓練組χ2=34779,P<0.001,驗證組χ2=6.941,P=0.543),因此僅對聯(lián)合序列個性化模型進行結(jié)果分析。聯(lián)合序列個性化預測模型得分=8.483-4.515×血鈣+2.619×邊緣+1.300×聯(lián)合序列影像組學標簽。結(jié)果顯示聯(lián)合序列影像組學標簽(OR=3.668,P<0.001)及邊緣(OR=13.719,P=0.033)為預測早期AP患者疾病進展的獨立危險因子(表3)。通過ROC曲線分析,在訓練組和驗證組中聯(lián)合序列個性化模型的預測效能均相對較高,AUC分別為0.97、0.98(表2,圖2),經(jīng)DeLong檢驗,聯(lián)合序列個性化模型與平掃及聯(lián)合序列影像組學標簽間差異無統(tǒng)計學意義(Z=1.139、1.265,P=0.255、0.206),與臨床模型對比差異有統(tǒng)計學意義(Z=4.365,P<0.001)。訓練組和驗證組的校正曲線(圖5)經(jīng)Hosmer-Lemeshow檢驗都顯示了良好的擬合效果(訓練組χ2=7.481,P=0.486,驗證組χ2=9.103,P=0.334)。DCA顯示平掃及聯(lián)合序列個性化模型與平掃及聯(lián)合序列影像組學標簽預測AP進展的臨床凈獲益明顯優(yōu)于臨床模型(圖6),其中聯(lián)合序列個性化模型與聯(lián)合序列影像組學標簽更好。
本研究結(jié)果表明平掃、聯(lián)合序列影像組學標簽及平掃、聯(lián)合序列個性化模型預測早期AP患者病程進展的診斷效能明顯優(yōu)于臨床預測模型,有助于臨床醫(yī)生盡早識別可能發(fā)生進展的AP患者,對其進行密集監(jiān)測和制定正確干預措施,改善患者的預后。
目前臨床評估AP患者嚴重程度及預后常采用APACHE-Ⅱ、BISAP等評分標準,但這些評分標準有自己的缺點,如費用高、項目多、使用煩瑣等,所需時間長(約48h后)[16]。BISAP評分相對簡單易行、準確率高,但在本研究中BISAP評分在預測AP病情進展上差異無統(tǒng)計學意義,可能與樣本量較少有關(guān)。本研究納入多種有潛在預測價值的臨床資料、CT特征中僅血鈣和邊緣差異有統(tǒng)計學意義,且二者都是臨床模型的獨立預測因子。Kawas等[17]認為低血鈣是SAP患者多系統(tǒng)器官功能衰竭的早期敏感指標,本研究中AP進展組患者血鈣水平低于AP非進展組患者。胰腺邊緣模糊或毛糙是AP最基本的CT表現(xiàn),結(jié)果顯示進展組患者胰腺邊緣模糊的病例數(shù)較非進展組的要多,早期階段胰腺邊緣模糊對預測疾病進展存在一定的價值。但基于臨床資料、CT特征建立的臨床模型在訓練組中的AUC為0.70,準確率0.62,診斷效能較低。
表3 訓練組預測急性胰腺炎進展聯(lián)合序列個性化模型的獨立危險因素
圖6 臨床模型、平掃及聯(lián)合序列影像組學標簽和平掃及聯(lián)合序列個性化模型預測AP進展決策曲線。All表示所有AP進展患者,None表示所有AP非進展患者。
急性胰腺炎因胰酶破壞腺泡細胞,炎性胰液容易向胰周脂肪間隙及胰腺外臟器擴散 、浸潤,胰周脂肪間隙可早期受到影響,胰周脂肪間隙的CT值及其特征變化可以反映炎癥嚴重程度,由此預測AP進展。已有研究[7-8]證明胰周積液及胰腺外壞死體積對預測AP的不良結(jié)果有顯著價值。但CT難以深層細致反映AP病理特征,且存在一定的主觀性。影像組學特征能夠以較低的成本客觀定量地獲取更多關(guān)于胰周脂肪間隙內(nèi)部異質(zhì)性的信息,有助于預測臨床結(jié)果。本研究對胰周脂肪間隙提取紋理特征分別建立平掃、動脈、靜脈、延遲及聯(lián)合序列影像組學標簽模型,預測效能都比較好(訓練組中AUC分別為0.94、0.89、0.90、0.88、0.94,驗證組中AUC分別為0.95、0.92、0.89、0.92、0.96),其中平掃序列與聯(lián)合序列影像組學標簽診斷效能更好,平掃序列與聯(lián)合序列影像組學標簽效能沒有顯著性差異(Z=0.234,P=0.815)。由于AP進展過程復雜,受多種臨床及病理因素影響,我們將平掃及聯(lián)合序列影像組學標簽分別與臨床資料及CT特征結(jié)合建立個性化模型,結(jié)果顯示沒有明顯提高診斷效能(平掃及聯(lián)合序列個性化模型在兩組中的AUC分別為0.94、0.99,0.97、0.98),說明臨床資料與常規(guī)CT特征貢獻較小。DCA顯示平掃、聯(lián)合序列影像組學標簽與平掃、聯(lián)合個性化模型臨床收益均明顯優(yōu)于臨床模型,其中聯(lián)合序列個性化模型與聯(lián)合序列影像組學標簽更好。單層平掃序列影像組學標簽在訓練組和驗證組中診斷效能均較好,相對簡單且無需注射對比劑,在日常工作中易操作實行,可作為生物標志物方便預測AP進展。
本研究的局限性:①胰腺周圍形態(tài)不規(guī)則難以準確勾畫ROI,本研究提取的影像組學特征都是基于病變胰腺最大層面的胰腺前方脂肪間隙的二維圖像特征,對整個胰腺周圍脂肪間隙的CT圖像進行三維圖像特征提取,可能更好反映病變的異質(zhì)性;②采用回顧性研究,樣本可能存在選擇偏倚;③樣本數(shù)還不夠大且為單中心研究,還需多中心研究進行驗證;④手動勾畫ROI及評判影像特征受個人主觀因素影響。
綜上所述,平掃、聯(lián)合序列影像組學標簽及平掃、聯(lián)合序列個性化模型預測早期AP病情進展具有較高的價值,明顯優(yōu)于臨床模型,均具有較好的臨床收益。平掃序列影像組學標簽簡便有效,是有潛在的應用前景生物標志物。