鄭繼盛,蘇 云,宮淑萍,趙曉敏*
1.濱州醫(yī)學(xué)院,山東 264003;2.煙臺(tái)市中心血站
胰十二指腸切除術(shù)(pancreaticoduodenectomy,PD)是治療胰腺壺腹部、胰頭部等部位惡性腫瘤的首選手術(shù)類(lèi)型,同時(shí)也是普外科復(fù)雜手術(shù)之一[1]。隨著醫(yī)療水平的提高,胰腺手術(shù)死亡率已降至2%以下[2-3],而術(shù)后胰瘺(pancreatic fistula,PF)發(fā)生率(3%~45%)卻居高不下[4],導(dǎo)致病人住院時(shí)間延長(zhǎng)、醫(yī)療費(fèi)用增加、死亡率上升等一系列問(wèn)題[5-7]。因此,早期采取有效措施預(yù)防高危人群發(fā)病非常重要。風(fēng)險(xiǎn)預(yù)測(cè)模型可以通過(guò)多個(gè)預(yù)測(cè)變量判斷結(jié)局事件的發(fā)生概率[8],胰瘺風(fēng)險(xiǎn)預(yù)測(cè)模型可以幫助醫(yī)護(hù)人員提前識(shí)別可能發(fā)生胰瘺的高危病人,從而制定適當(dāng)?shù)尼t(yī)療、護(hù)理決策[9]?,F(xiàn)對(duì)國(guó)內(nèi)外胰十二指腸切除術(shù)后胰瘺風(fēng)險(xiǎn)預(yù)測(cè)模型的構(gòu)建、驗(yàn)證及呈現(xiàn)等進(jìn)行綜述,以期為臨床實(shí)踐與后續(xù)模型開(kāi)發(fā)提供參考。
1.1 胰十二指腸切除術(shù) 胰十二指腸切除術(shù)是指部分胰腺(主要指胰頭部)、臨近十二指腸、部分胃、空腸近端、膽管十二指腸球后段以下部分的切除以及膽腸吻合、胰腸吻合、胃腸吻合、腸腸吻合的消化道重建。該手術(shù)是腹部外科操作技術(shù)復(fù)雜、創(chuàng)傷較大的手術(shù)之一,是治療胰頭部、壺腹部、遠(yuǎn)端膽道惡性腫瘤的首選治療方式[10]。
1.2 胰瘺 胰瘺是胰腺導(dǎo)管上皮與其他上皮表面的異常通道,內(nèi)有源自胰腺富含酶類(lèi)的液體。術(shù)后胰瘺(postoperative pancreatic fistula,POPF)的診斷標(biāo)準(zhǔn)依據(jù)國(guó)際胰腺外科研究小組2016 年發(fā)布的關(guān)于臨床相關(guān)胰瘺(clinically relevant postoperative pancreatic fistula,CR-POPF)的定義[4]:術(shù)后≥3 d 任意量的引流液中淀粉酶濃度高于正常血清淀粉酶濃度上限3 倍以上,同時(shí)病人有相應(yīng)臨床表現(xiàn)。該定義僅包括B 級(jí)和C 級(jí)胰瘺,去除了國(guó)際胰瘺分類(lèi)研究小組在2005 年胰瘺定義中的無(wú)相關(guān)臨床表現(xiàn)的A 級(jí)胰瘺(生化瘺)[11]。
1.3 臨床預(yù)測(cè)模型 臨床預(yù)測(cè)模型是指將多個(gè)與臨床結(jié)局變量的危險(xiǎn)因素相關(guān)聯(lián),從而構(gòu)建可以得出臨床結(jié)局事件發(fā)生概率的函數(shù)公式[12]。預(yù)測(cè)模型包括診斷模型與預(yù)后模型,POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型為診斷模型,通常通過(guò)Logistic 回歸構(gòu)建模型。模型性能可以通過(guò)C 統(tǒng)計(jì)量、校準(zhǔn)圖、Hosmer-Lemeshow 擬合優(yōu)度檢驗(yàn)(H-L 檢驗(yàn))以及臨床決策曲線(xiàn)等進(jìn)行評(píng)價(jià)[13]。模型的呈現(xiàn)方式包括公式、風(fēng)險(xiǎn)評(píng)分系統(tǒng)、列線(xiàn)圖、網(wǎng)頁(yè)計(jì)算器等,其中風(fēng)險(xiǎn)評(píng)分與列線(xiàn)圖更便于臨床應(yīng)用[14]。
1.4 臨床預(yù)測(cè)模型報(bào)告指南 預(yù)測(cè)模型構(gòu)建研究數(shù)據(jù)提取和質(zhì)量評(píng)價(jià)清單(checklist for critical appraisal and date extraction for systematic reviews of prediction modelling studies,CHARMS)[15],個(gè)體預(yù)測(cè)或診斷用多變量預(yù)測(cè)模型透明報(bào)告(the transparent reporting of a multivariable prediction moder for individual prognosis or diagnosis,TRIPOD)[15],臨床預(yù)測(cè)模型偏倚風(fēng)險(xiǎn)和適用性的評(píng)估工具(prediction model risk of bias assessment tool,PROBAST)[16]分別在2014 年、2015 年和2019 年發(fā)布。TRIPOD 作為報(bào)告準(zhǔn)則多用于原始研究,CHARMS 作為數(shù)據(jù)提取指南、PROBAST 作為質(zhì)量評(píng)價(jià)指南用于臨床預(yù)測(cè)模型的系統(tǒng)評(píng)價(jià),三者對(duì)于了解臨床預(yù)測(cè)模型以及臨床預(yù)測(cè)模型研究撰寫(xiě)規(guī)范有著重要指導(dǎo)意義。
2.1 瘺管風(fēng)險(xiǎn)評(píng)分(Fistula Risk Score,F(xiàn)RS) FRS由國(guó)外學(xué)者Callery 等[17]開(kāi)發(fā),是中華醫(yī)學(xué)會(huì)外科學(xué)分會(huì)胰腺外科學(xué)組推薦的預(yù)測(cè)CR-POPF 的風(fēng)險(xiǎn)評(píng)分模型[18]。該模型基于國(guó)際胰瘺分類(lèi)研究小組在2005 年公認(rèn)的CR-POPF 的危險(xiǎn)因素(小導(dǎo)管、軟胰腺、高危病理、失血過(guò)多)[11]創(chuàng)建。研究構(gòu)建了3 個(gè)風(fēng)險(xiǎn)評(píng)分模型:模型1 為通過(guò)4 個(gè)危險(xiǎn)因素構(gòu)建的0~4 分的風(fēng)險(xiǎn)評(píng)分模型;模型2 根據(jù)其建模后的回歸系數(shù)進(jìn)行加權(quán),通過(guò)OR 值倍數(shù)確定分?jǐn)?shù),風(fēng)險(xiǎn)評(píng)分范圍為4~22 分;模型3 類(lèi)似于模型2 但是對(duì)其進(jìn)行了簡(jiǎn)化,不再通過(guò)OR 值對(duì)其連續(xù)資料進(jìn)行加分,而是進(jìn)行了等級(jí)資料遞增后的分?jǐn)?shù)調(diào)整,分?jǐn)?shù)區(qū)間為0~10 分。模型3 相較于模型1、模型2 來(lái)說(shuō),更易理解與接受,臨床實(shí)用性更強(qiáng)。且模型3 經(jīng)過(guò)內(nèi)部驗(yàn)證后的表現(xiàn)也優(yōu)于其他模型,受試者工作特征曲線(xiàn)下面積(area under curve,AUC)為0.942(模型3)>0.938(模型2)>0.936(模型1)。模型3 的風(fēng)險(xiǎn)評(píng)分標(biāo)準(zhǔn):0 分表示不會(huì)發(fā)生CR-POPF,9~10 分表示必然會(huì)發(fā)生CR-POPF,超過(guò)7 分幾乎都會(huì)發(fā)生CR-POPF。故該模型分為4 個(gè)風(fēng)險(xiǎn)層次:0 分為可忽略風(fēng)險(xiǎn),1 分或2 分為低風(fēng)險(xiǎn),3~6 分為中風(fēng)險(xiǎn),7~10 分為高風(fēng)險(xiǎn)。國(guó)內(nèi)外多項(xiàng)研究表明,該風(fēng)險(xiǎn)評(píng)分模型有著較強(qiáng)的預(yù)測(cè)能力及臨床實(shí)用性[19-22]。但也存在一些潛在不足之處:①模型的時(shí)效性亟待探討,該模型采用的是2009 年—2011 年的數(shù)據(jù),模型中預(yù)測(cè)因子是否需要增減,研究人群的人口學(xué)特征是否發(fā)生變化有待考證;②失血量的預(yù)測(cè)效能不足,彭斌等[19-23]在其研究中沒(méi)有觀(guān)察到FRS 中重要預(yù)測(cè)因子失血量的統(tǒng)計(jì)學(xué)差異,Grendar 等[24-25]的研究也同樣證明失血量與CR-POPF 的發(fā)生缺乏關(guān)聯(lián)。
2.2 替代瘺管風(fēng)險(xiǎn)評(píng)分(Alternative Fistula Risk Score,a-FRS) 2019 年,Mungroop 等[26]構(gòu)建了a-FRS,該風(fēng)險(xiǎn)預(yù)測(cè)模型由3 個(gè)預(yù)測(cè)因子組成:胰腺質(zhì)地、胰管直徑、體質(zhì)指數(shù)(body mass index,BMI)。該研究基于兩個(gè)大型數(shù)據(jù)庫(kù)進(jìn)行建模與內(nèi)部驗(yàn)證,并通過(guò)兩個(gè)機(jī)構(gòu)的數(shù)據(jù)進(jìn)行外部驗(yàn)證。模型內(nèi)部驗(yàn)證的C 統(tǒng)計(jì)量為[0.75,95%CI(0.71,0.78)],外部驗(yàn)證的C 統(tǒng)計(jì)量為[0.78,95%CI(0.74,0.82)],展現(xiàn)出較好的預(yù)測(cè)效能與可泛化性。評(píng)價(jià)a-FRS 模型離不開(kāi)與原FRS 模型進(jìn)行比較,作者分別基于2005 年與2016 年的POPF 定義將驗(yàn)證數(shù)據(jù)集用FRS 與a-FRS 進(jìn)行POPF 的風(fēng)險(xiǎn)評(píng)估,結(jié)果表明在2005 年的POPF 定義中a-FRS 模型較FRS 模型性能有所改善,而在2016 年的CR-POPF 定義中a-FRS 模型與FRS 模型表現(xiàn)相當(dāng)。除此之外,國(guó)內(nèi)外其他學(xué)者也對(duì)上述兩個(gè)模型進(jìn)行了比較研究。沈健等[27]研究發(fā)現(xiàn),F(xiàn)RS 模型對(duì)CR-POPF 的預(yù)測(cè)價(jià)值大于a-FRS 模型;韓國(guó)學(xué)者Ryu 等[28]比較了FRS 和a-FRS 在韓國(guó)人群中的差別,結(jié)果表明兩風(fēng)險(xiǎn)評(píng)分模型都具有一定的預(yù)測(cè)效能,但部分指標(biāo)(a-FRS 的胰腺質(zhì)地和FRS 的估計(jì)出血量)統(tǒng)計(jì)學(xué)效能低。
2.3 更新的替代胰瘺風(fēng)險(xiǎn)評(píng)分(Updated Alternative Fistula Risk Score,ua-FRS) Mungroop 等[29]于2021 年基于a-FRS 構(gòu)建了ua-FRS,該模型同樣是使用大型數(shù)據(jù)庫(kù)進(jìn)行的更新與驗(yàn)證,但參與人群變?yōu)榻邮芪?chuàng)胰十二指腸切除術(shù)的病人(minimally invasive pancreatoduodenectomy,MIPD)。 ua-FRS 在原有a-FRS3 個(gè)預(yù)測(cè)因子的基礎(chǔ)上添加了性別變量,其內(nèi)部驗(yàn)證的C 統(tǒng)計(jì)量為0.75,并基于2005 年和2016 年定義分別對(duì)數(shù)據(jù)庫(kù)進(jìn)行了外部驗(yàn)證,其C 統(tǒng)計(jì)量分別為0.73,0.76,表明模型預(yù)測(cè)效能表現(xiàn)較好,其校準(zhǔn)圖也表現(xiàn)出了較好的校準(zhǔn)水平。該模型的呈現(xiàn)除公式外,還構(gòu)建了網(wǎng)頁(yè)計(jì)算器,更方便了CR-POPF 風(fēng)險(xiǎn)概率的計(jì)算。作者同樣基于訓(xùn)練集數(shù)據(jù)庫(kù)對(duì)FRS 和a-FRS 進(jìn)行了驗(yàn)證,其C 統(tǒng)計(jì)量分別為0.69,0.68,預(yù)測(cè)效能均低于ua-FRS。但學(xué)者Hayashi 等[30]對(duì)FRS、a-FRS、ua-FRS 模型的單中心外部驗(yàn)證顯示,三者在C統(tǒng)計(jì)量上并未表現(xiàn)出統(tǒng)計(jì)學(xué)差異。
2.4 其他POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型
2.4.1 基于術(shù)前指標(biāo)的POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型Yamamoto 等[31]于日本國(guó)立癌癥中心醫(yī)院構(gòu)建的術(shù)前POPF 風(fēng)險(xiǎn)預(yù)測(cè)系統(tǒng),被稱(chēng)為NCCH 預(yù)測(cè)系統(tǒng)。與FRS 和a-FRS 模型不同的是,該預(yù)測(cè)系統(tǒng)是基于病人手術(shù)前指標(biāo)來(lái)預(yù)測(cè)病人術(shù)后胰瘺的發(fā)生,可以在術(shù)前對(duì)病人可能存在的術(shù)后問(wèn)題進(jìn)行評(píng)估,以采取更合適的手術(shù)方式或送往更高級(jí)的胰腺外科研究中心進(jìn)行手術(shù)治療。NCCH 預(yù)測(cè)系統(tǒng)通過(guò)5 個(gè)術(shù)前因子來(lái)預(yù)測(cè)CR-POPF,包括男性(1 分)、主胰管指數(shù)<0.25(2 分)、CT 示遠(yuǎn)離門(mén)靜脈(2 分)、非胰腺癌(1 分)、腹內(nèi)厚度>65 mm(1 分)共7 分。該模型的C 統(tǒng)計(jì)量為0.808,同時(shí)該風(fēng)險(xiǎn)預(yù)測(cè)系統(tǒng)在驗(yàn)證組預(yù)測(cè)B 級(jí)和C 級(jí)胰瘺時(shí)具有較好的表現(xiàn)(C 統(tǒng)計(jì)量為0.834)。國(guó)內(nèi)學(xué)者黃強(qiáng)等[32-33]使用該模型進(jìn)行了臨床應(yīng)用驗(yàn)證,C 統(tǒng)計(jì)量分別為0.946 與0.910,模型表現(xiàn)較好。Roberts 等[34]也進(jìn)行了類(lèi)似的術(shù)前指標(biāo)構(gòu)建模型,得到兩個(gè)預(yù)測(cè)因子:BMI和胰管寬度,C 統(tǒng)計(jì)量為0.832。有研究通過(guò)9 所醫(yī)療中心的1 898 例病人對(duì)Callery 等[17]、Mungroop 等[26]和Roberts 等[34]構(gòu)建的模型進(jìn)行外部驗(yàn)證,其C 統(tǒng)計(jì)量分別為0.61,0.64 和0.63,并得出上述3 個(gè)模型在韓國(guó)隊(duì)列中表現(xiàn)較差的結(jié)論。
2.4.2 基于機(jī)器學(xué)習(xí)算法的POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型 機(jī)器學(xué)習(xí)算法目前正在變得越來(lái)越流行[35],已在眾多風(fēng)險(xiǎn)預(yù)測(cè)研究中展示出優(yōu)異表現(xiàn)[36-38]。機(jī)器學(xué)習(xí)算法對(duì)待數(shù)據(jù)更加包容,對(duì)特征的處理及篩選更加靈活,故其對(duì)結(jié)局事件的預(yù)測(cè)更加精確。在POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型研究中,機(jī)器學(xué)習(xí)算法研究較少。Perri 等[39]通過(guò)機(jī)器學(xué)習(xí)算法構(gòu)建CR-POPF 回歸樹(shù)模型,根據(jù)主胰管直徑和BMI 兩個(gè)預(yù)測(cè)因子將病人劃分為低、中、高3 個(gè)風(fēng)險(xiǎn)組,其訓(xùn)練集與驗(yàn)證集中3 個(gè)風(fēng)險(xiǎn)組的CR-POPF 實(shí)際發(fā)生情況不同,表明該回歸樹(shù)風(fēng)險(xiǎn)分層能較好地區(qū)分不同CR-POPF 風(fēng)險(xiǎn)的病人,從而可以依此指導(dǎo)臨床決策。Han 等[40]也利用機(jī)器學(xué)習(xí)算法中的隨機(jī)森林(random forest,RF)和神經(jīng)網(wǎng)絡(luò)(neural network,NN)探索更高預(yù)測(cè)效能的POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型,其中作者使用遞歸特征消除法(recursive feature elimination,RFE)進(jìn)行最優(yōu)特征的選擇,對(duì)模型中可能存在的過(guò)度擬合問(wèn)題做出了較好的處理,最后通過(guò)RFE 篩選出16 個(gè)變量所構(gòu)建的神經(jīng)網(wǎng)絡(luò)模型表現(xiàn)出最大的C 統(tǒng)計(jì)量(0.74),表明該模型擁有較好的臨床預(yù)測(cè)性能,且作者基于神經(jīng)網(wǎng)絡(luò)模型構(gòu)建了網(wǎng)頁(yè)計(jì)算器,使預(yù)測(cè)CR-POPF 更加方便與易獲取。
相較于國(guó)外的POPF 預(yù)測(cè)研究,國(guó)內(nèi)的POPF 預(yù)測(cè)模型研究相對(duì)較少,多數(shù)研究?jī)H停留在POPF 的危險(xiǎn)因素分析,并未進(jìn)一步建模研究。相較于國(guó)外研究,國(guó)內(nèi)學(xué)者的研究具有人群代表性較好、危險(xiǎn)因素本土化的優(yōu)點(diǎn),更加適合中國(guó)人群。在國(guó)內(nèi)的POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型中,比較有代表性的有李軻等[41-43]的研究。李軻[41]分析了296 例行胰十二指腸切除術(shù)的病人,其中訓(xùn)練集222 例,驗(yàn)證集74 例,對(duì)收集的22 個(gè)建模指標(biāo)進(jìn)行統(tǒng)計(jì)學(xué)分析后構(gòu)建回歸模型,結(jié)果表明年齡≥65 歲、術(shù)前清蛋白<30 g/L、術(shù)中出血量≥600 mL、胰腺質(zhì)地軟以及胰管直徑<3 mm 是胰十二指腸切除術(shù)術(shù)后發(fā)生CR-POPF 的獨(dú)立危險(xiǎn)因素。該模型在驗(yàn)證集的C 統(tǒng)計(jì)量為0.862,H-L 檢驗(yàn)結(jié)果顯示,χ2=2.837,P=0.725,表明模型的區(qū)分度與校準(zhǔn)度良好。徐西伯等[42]研究發(fā)現(xiàn),BMI>25 kg/m2、術(shù)中探查主胰管直徑<3 mm 和術(shù)后首日腹腔積液淀粉酶>2 651 U/L 是發(fā)生CR-POPF 的獨(dú)立危險(xiǎn)因素,而曹昕彤等[42]也在研究中指出術(shù)后第1 天腹腔引流液淀粉酶水平、腹腔引流液細(xì)菌培養(yǎng)結(jié)果和血清清蛋白水平是發(fā)生CR-POPF 的獨(dú)立危險(xiǎn)因素,兩研究所構(gòu)建的模型區(qū)分度分別為0.868 和0.911,模型表現(xiàn)較好。但曹昕彤等[43]的研究中未設(shè)置驗(yàn)證集,無(wú)法證明模型的外推性等問(wèn)題;李珂與徐西伯的驗(yàn)證集人數(shù)均低于PROBAST 標(biāo)準(zhǔn)[16]的100 個(gè)參與者,在樣本量方面表現(xiàn)出較高的偏倚風(fēng)險(xiǎn)。Xia 等[44-45]單中心研究以2009 年1 月—2015 年10 月225 例胰十二指腸切除術(shù)病人作為訓(xùn)練集,進(jìn)一步選擇2015 年11 月—2017 年11 月136 例胰十二指腸切除術(shù)病人作為驗(yàn)證集,兩組病人術(shù)前準(zhǔn)備、手術(shù)方式及術(shù)后管理措施一致。經(jīng)多元Logistic 回歸建模得出胰腺質(zhì)地、主胰管直徑、是否擴(kuò)大淋巴清掃以及術(shù)后第1 天血清清蛋白是影響CR-POPF 的獨(dú)立危險(xiǎn)因素,其公式代入驗(yàn)證組后C 統(tǒng)計(jì)量為0.777,模型預(yù)測(cè)效能較好。作者還將其各獨(dú)立危險(xiǎn)因素的回歸系數(shù)值進(jìn)行加權(quán)賦值,構(gòu)建了胰瘺風(fēng)險(xiǎn)評(píng)分系統(tǒng),總分為6 分,該風(fēng)險(xiǎn)評(píng)分系統(tǒng)在訓(xùn)練集和驗(yàn)證集中表現(xiàn)均較好,C 統(tǒng)計(jì)量分別為0.813 和0.806。該模型擁有較好的性能與臨床實(shí)用性,未來(lái)可以進(jìn)一步設(shè)計(jì)獨(dú)立外部驗(yàn)證研究來(lái)證明該模型的普適性。
國(guó)內(nèi)外POPF 風(fēng)險(xiǎn)預(yù)測(cè)模型報(bào)告均具有較好的預(yù)測(cè)效能和臨床使用價(jià)值,但還存在模型研究中數(shù)據(jù)來(lái)源與處理等報(bào)告不全、建模統(tǒng)計(jì)方法可能會(huì)造成較高偏倚等問(wèn)題。今后研究中應(yīng)當(dāng)在模型構(gòu)建過(guò)程中使用TRIPOD 報(bào)告準(zhǔn)則規(guī)范報(bào)告及PROBAST 偏倚評(píng)價(jià)工具進(jìn)行自檢,并通過(guò)交叉驗(yàn)證或正則化等統(tǒng)計(jì)學(xué)方法以及大樣本量或外部驗(yàn)證等解決模型的過(guò)度擬合問(wèn)題,以構(gòu)建更優(yōu)化的POPF 臨床預(yù)測(cè)模型,為CR-POPF的早期篩查與早期醫(yī)療護(hù)理決策提供更可靠的理論依據(jù)。