陳鈺瑩 黃小華 唐玲玲 胡云濤 劉 念
急性胰腺炎(acute pancreatitis,AP)是由多種病因引起胰腺自身消化的胰腺損傷性疾病[1]。目前我國常見的AP 主要由膽道結石引起的膽源性急性胰腺炎(biliary acute pancreatitis,BAP)[2]。大多數(shù)BAP患者的病程和預后難以預測,部分患者會發(fā)展為重癥BAP,病情危重,死亡率接近30%[3]。早期準確評估BAP嚴重程度并積極治療對改善其預后極為重要?,F(xiàn)有的臨床評分系統(tǒng)如急性胰腺炎嚴重程度床旁指數(shù)(BISAP)及改良CT 嚴重指數(shù)評分(MCTSI)等可用于臨床早期對BAP 嚴重程度的評估,但其操作繁瑣,受時間限制,準確率較低[4-5]。影像組學可從任何醫(yī)學圖像中提取形狀、密度、紋理等特征,充分挖掘圖像中肉眼無法識別的隱藏信息,以提高臨床診斷及預后評估的準確性[6-7]。有研究表明基于MRI 影像組學建立的模型對急性胰腺炎嚴重程度預測取得了較好的效果[8],而CT圖像更易獲取,目前基于增強CT影像組學早期預測BAP 嚴重程度的研究未見報道。因此,本研究擬探討基于增強CT 影像組學評估BAP 嚴重程度的價值,為臨床患者個性化治療決策提供參考。
回顧性分析2016年1月至2022年4月期間在我院診斷為BAP 的患者。本研究已通過醫(yī)院倫理會批準(批準文號:2022ER199-1),由于是回顧性研究,故免除了受試者知情同意。納入的152 例BAP 中,男62 例,女90 例,年齡19~95 歲,平均年齡(58.04±16.77)歲。由2名醫(yī)師依據(jù)《中國急性胰腺炎診治指南(2021 版)》修訂版Atlanta 分級[9]將患者按嚴重程度分為膽源性輕癥急性胰腺炎(biliary mild acute pancreatitis,BMAP) 62 例,膽源性中重癥急性胰腺炎 (biliary moderately severe acute pancreatitis,BMSAP) 42 例,膽源性重癥急性胰腺炎(biliary severe acute pancreatitis,BSAP)48 例,其中BMAP和BMSAP 患者被納入非重癥組,而BSAP 患者被納入重癥組;包括膽囊結石119 例,膽總管結石22 例,膽囊和膽總管結石并存11例。
納入標準:①所有病例均符合《中國急性胰腺炎診治指南(2021)》中對AP 的診斷及嚴重程度分類要求[9];②BAP 的診斷在AP 診斷基礎上,經(jīng)影像學檢查(如B 超、CT、MRI/MRCP)確定其病因為膽源性;③AP 發(fā)病3 d 內行CT 檢查。排除標準:①慢性胰腺炎、胰腺腫瘤等胰腺疾??;②臨床醫(yī)療記錄不完整者;③CT圖像質量不能滿足臨床診斷要求。
采用西門子Force CT 行腹部掃描,范圍從膈肌至腎臟下極。掃描參數(shù):管電壓120 kV,智能毫安秒,層厚5 mm,層間隔5 mm,球管旋轉時間0.50 s,準直器寬度0.625 mm,矩陣512×512。經(jīng)肘前靜脈以3.0~3.5 mL/s 速率注射非離子型對比劑碘海醇1~2 mL/kg,注射后30、60 s分別獲得動、靜脈期圖像。
由2 名有5 年以上臨床經(jīng)驗的腹部放射科醫(yī)生采用雙盲法閱片,在軸位CT 增強圖像上(動脈期、靜脈期)使用3D slicer軟件勾畫沿胰腺邊緣逐層勾畫胰腺實質(包括壞死區(qū),并盡量避開血管和膽總管)。
由2名放射科醫(yī)生在所有病例中隨機抽取50例勾畫感興趣區(qū),并進行影像組學特征的一致性評價,計算組內相關系數(shù)(interclass correlation coefficient,ICC),以評估特征提取的組間一致性。1 周后放射醫(yī)生1 用同樣方法再次勾畫靶區(qū)提取特征,并將結果與其第一次提取的特征進行比較以評價組內影像組學特征的一致性。ICC>0.75 表示特征一致性較好。
將152例數(shù)據(jù)按7∶3的比例通過隨機分層抽樣分為訓練組和驗證組:訓練組105例(NBSAP 組72例,BSAP 組33 例),驗 證 組47 例(NBSAP 組32 例,BSAP 組15 例)。采用R 軟件進行數(shù)據(jù)標準化及特征選擇;采用單因素分析及最小絕對收縮和選擇算子(LASSO)算法降維,分別篩選出動、靜脈期最佳特征子集;采用logistic 回歸構建影像組學模型:動脈期模型、靜脈期模型和聯(lián)合模型(動脈期+靜脈期),用曲線下面積(AUC)來評價各模型的評估效能。
在訓練組及驗證組中,采用不同的評分系統(tǒng)(BISAP 和MCTSI 評分)對每例患者進行評分,采用AUC、靈敏度、特異度和準確度評估每個評分系統(tǒng)的評估性能,并將每個評分系統(tǒng)的AUC 與各影像組學模型的AUC進行比較。
采用SPSS 26.0 和R 軟件3.5.3 進行統(tǒng)計分析。符合正態(tài)分布的計量資料以均數(shù)±標準差表示,采用獨立樣本t檢驗;不符合正態(tài)分布的計量資料以M(Q1,Q3)表示,采用Mann-WhitneyU檢驗。計數(shù)資料采用卡方檢驗或Fisher 精確概率檢驗。采用AUC 評估各模型的評估性能。
在訓練組和驗證組中,BISAP 評分、MCTSI 評分、并發(fā)癥、腹水/胸腔積液及壞死的發(fā)生率在非重癥組和重癥組之間差異均有統(tǒng)計學意義(P<0.05)。重癥組BISAP 評分、MCTSI 評分中位數(shù)高于非重癥組;重癥組并發(fā)癥、腹水/胸腔積液及壞死的發(fā)生率也高于非重癥組(P<0.05)。其性別、年齡、結石部位、結石大小、結石單發(fā)/多發(fā)、淀粉酶及脂肪酶在重癥組與非重癥組之間差異無統(tǒng)計學意義(P>0.05)。見表1。
表1 BSAP組和BNSAP組的臨床特征
通過觀察者內和觀察者間一致性檢驗保留了ICC>0.75 的特征,動脈期、靜脈期分別保留了722、730 個特征。通過單因素分析和LASSO 降維后,獲得動脈期3 個、靜脈期6 個影像組學特征(圖1~3)。
圖1 動脈期(A)和靜脈期(B)組間一致性檢驗圖
圖2 動脈期(A)和靜脈期(B)特征篩選收斂圖
圖3 動脈期(A)和靜脈期(B)LASSO特征篩選圖(LASSO模型取最簡潔模型剩余特征)
基于動脈期、靜脈期篩選的特征分別建立動脈期模型、靜脈期模型及聯(lián)合模型。在訓練組中,動脈期模型、靜脈期模型、聯(lián)合模型、BISAP評分及MCTSI評 分 的AUC 分 別 為0.836、0.876、0.924、0.725 及0.713;在驗證組中,動脈期模型、靜脈期模型、聯(lián)合模型、BISAP 評分及MCTSI 評分的AUC 分別為0.835、0.781、0.887、0.702 及0.702。該結果表明各期影像組學模型在訓練組和驗證組中均具有良好的性能,聯(lián)合模型在訓練組和驗證組中評估效能最高,均高于各單一期相組學模型及臨床評分系統(tǒng)(BISAP評分及MCTSI評分),表明基于CT增強各期建立的影像組學模型效能均優(yōu)于臨床評分系統(tǒng)。詳見表2。
表2 各模型在訓練組及驗證組中的預測效能
膽源性急性胰腺炎是由各種膽道原因引起壺腹部阻塞或黏膜損傷水腫,膽汁逆流至胰管并激活胰酶,而導致胰腺組織的損傷,其嚴重程度不同決定了治療方法的不同,且與預后有關[10]。影像組學對具有高通量特征的醫(yī)學圖像進行定量化分析,能更客觀地反映病變的異質性,已廣泛應用于胰腺疾病的診斷及預后分析中[11-12]。Hu 等[13]基于磁共振T2WI 序列影像組學特征中篩選的8 個紋理特征,建立的邏輯回歸模型可預測急性胰腺炎的復發(fā),且其預測效能優(yōu)于臨床模型。Lin 等[8]建立的支持向量機模型在預測急性胰腺炎嚴重程度中同樣取得了較好的預測效能。上述研究結果均體現(xiàn)了影像組學模型在急性胰腺炎中的良好預測性能,但目前未有針對BAP 的詳細研究。因此,本研究采用logistic 回歸方法建立了基于增強CT 的影像組學模型,與兩種臨床評分系統(tǒng)相比影像組學模型在評估BAP 嚴重程度方面具有更好的性能。本研究的優(yōu)勢在于臨床中BAP 的CT 圖像較MRI圖像更易獲取,且建立了動靜脈雙期聯(lián)合模型,可提高BAP 影像組學模型的評估性能。
在本研究中,壞死、并發(fā)癥及胸腔積液/腹水的發(fā)生率在重癥組與非重癥組間比較差異均有統(tǒng)計學意義(P<0.05)。先前研究表明胰腺壞死與器官衰竭和重癥胰腺炎有關[14-15],本研究也顯示胰腺壞死在BSAP 組更常見,因在勾畫靶區(qū)時包含壞死區(qū),未將壞死納入到臨床模型;且并發(fā)癥及胸腔積液/腹水也包含在2種評分系統(tǒng)中,故也未將并發(fā)癥及胸腔積液/腹水納入到臨床模型中。其次在訓練集和驗證集中結石大小、單發(fā)/多發(fā)、類型等臨床特征在NBSAP 組及BSAP 組間差異無統(tǒng)計學意義(P>0.05),可能與樣本量較少或隨機分配造成的選擇偏差有關。因此,本研究沒有將上述臨床信息作為危險因素單獨建立臨床評估模型。目前常用于評價AP 嚴重程度的評分系統(tǒng)主要有BISAP 評分及MCTSI 評分等,各評分都有獨自的優(yōu)缺點。BISAP評分最為便捷,但對器官功能衰竭的預測價值較差;由于AP 的壞死可能存在進展的過程,MCTSI 評分受限于增強CT 的選擇時機,也不能更好地預測其嚴重程度。因此本研究計算了BISAP評分及MCTSI 評分并將其與影像組學模型比較,以期獲得一個評估效能更好的評估模型。
本研究在經(jīng)過特征降維篩選后,最終聯(lián)合模型保留了9個組學特征(3個動脈期,6個靜脈期最佳特征子集)。其中2 個直方圖特征是最常用的的計算圖像中像素不同灰度值出現(xiàn)的頻率;6 個灰度共生矩陣特征反映圖像灰度在不同步長,方向變化的整體信息;1 個灰度相關矩陣是從灰度共生矩陣中計算出來的,反映了圖像局部灰度信息的相關性。本研究結果表明基于靜脈期組學的預測模型效能優(yōu)于動脈期的模型(AUC:0.876 vs 0.836),聯(lián)合(動脈期+靜脈期)組學模型的評估效能高于單一期相(AUC=0.924),且各期組學評估模型均高于臨床評分系統(tǒng)(BISAP評分及MCTSI 評分),體現(xiàn)了多期相影像組學模型可提供更多的胰腺實質及其周圍病變的信息,在評估BAP嚴重程度中更高的價值。
本研究局限性:①本研究納入樣本量較少,重癥組與非重癥組數(shù)據(jù)量較不平衡,可能存在一定程度偏移;②胰腺炎輪廓和周圍炎癥的手動勾畫可能受臨床醫(yī)師的主觀影響;③本研究納入為單中心數(shù)據(jù),患者群體和成像方法可能存在偏差。在今后研究中將采用多中心、大樣本、標準化及前瞻性研究,以提高影像組學模型的預測性能。
總之,增強CT 影像組學模型可評估BAP 的嚴重程度,動靜脈期聯(lián)合模型具有更高的評估價值。影像組學作為一種定量分析方法,在BAP 嚴重程度的早期評估中具有潛在的臨床價值。