李耿霖 宋文鑄 賴悅園 李煒玥 陳璐
術(shù)后并發(fā)癥是指手術(shù)操作引起的其他組織器官的損傷、缺失、功能障礙等。術(shù)后并發(fā)癥的發(fā)生不僅消耗醫(yī)療資源,同時(shí)加重患者的生活負(fù)擔(dān),也在無(wú)形中影響醫(yī)患關(guān)系。如何減少術(shù)后并發(fā)癥的發(fā)生一直是醫(yī)學(xué)研究的熱點(diǎn)。術(shù)后并發(fā)癥風(fēng)險(xiǎn)預(yù)測(cè)模型的建立可以幫助醫(yī)生預(yù)測(cè)患者發(fā)生術(shù)后并發(fā)癥的可能性,可早期篩查高危風(fēng)險(xiǎn)人群,通過(guò)減少術(shù)前相關(guān)危險(xiǎn)因素和避免術(shù)中可能引起術(shù)后并發(fā)癥的相關(guān)操作等來(lái)降低術(shù)后并發(fā)癥發(fā)生的概率。隨著人工智能技術(shù)與醫(yī)療行業(yè)的深度融合,研究者借助計(jì)算機(jī)建立神經(jīng)網(wǎng)絡(luò)模型來(lái)進(jìn)行術(shù)后并發(fā)癥風(fēng)險(xiǎn)的預(yù)測(cè),現(xiàn)對(duì)各種術(shù)后并發(fā)癥的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型研究進(jìn)展進(jìn)行綜述。
在許多醫(yī)學(xué)領(lǐng)域,機(jī)器學(xué)習(xí)(ML)已經(jīng)是增加診斷和預(yù)后準(zhǔn)確性的有效工具[1]。最常用的ML算法有隨機(jī)森林、人工神經(jīng)網(wǎng)絡(luò)和Logistic回歸[2]。人工神經(jīng)網(wǎng)絡(luò)是通過(guò)模擬人類腦神經(jīng)元處理信息的邏輯方式而建立的模擬邏輯算法,擁有強(qiáng)大的信息處理和分析能力。1943年McCulloch和Pitts提出的M-P模型標(biāo)志著人工神經(jīng)網(wǎng)絡(luò)的誕生[3]。目前人工神經(jīng)網(wǎng)絡(luò)已經(jīng)發(fā)展出多種類型,包括前饋神經(jīng)網(wǎng)絡(luò)(FNN)和遞歸神經(jīng)網(wǎng)絡(luò)(RNN)等,并在醫(yī)學(xué)診斷及醫(yī)學(xué)決策領(lǐng)域發(fā)揮作用[4]。
盡管人工神經(jīng)網(wǎng)絡(luò)種類繁多,結(jié)構(gòu)各異,但大致可分為輸入層、隱含層和輸出層。在輸入層中設(shè)定好數(shù)據(jù)的特征變量,即可能導(dǎo)致最終結(jié)果的因素,數(shù)據(jù)集經(jīng)過(guò)標(biāo)準(zhǔn)化處理后輸入系統(tǒng)。隱含層有多個(gè)節(jié)點(diǎn),信息在此進(jìn)行處理加工,進(jìn)行神經(jīng)元的擬合,神經(jīng)元間通過(guò)不同權(quán)值以不同強(qiáng)度建立非線性連接,而后在輸出層得到擬合結(jié)果。通常采用受試者工作曲線(ROC)中曲線下面積(AUC)、準(zhǔn)確度、敏感度、F1測(cè)量值(F1)等指標(biāo)評(píng)價(jià)模型的預(yù)測(cè)效果。
2.1 前饋神經(jīng)網(wǎng)絡(luò) 目前,基于人工神經(jīng)網(wǎng)絡(luò)的術(shù)后并發(fā)癥風(fēng)險(xiǎn)預(yù)測(cè)模型多采用前饋神經(jīng)網(wǎng)絡(luò)。常見的模型有多層感知器、卷積神經(jīng)網(wǎng)絡(luò)、BP神經(jīng)網(wǎng)絡(luò)等。Hofer等[5]建立了3個(gè)前饋神經(jīng)網(wǎng)絡(luò)模型用于預(yù)測(cè)術(shù)后急性腎損傷(AKI)、再插管和死亡率,模型具有完全連接層,采用梯度下降算法。輸入的數(shù)據(jù)集來(lái)自UCLA大學(xué)59 981例手術(shù)病例,其中80%為訓(xùn)練集,20%為測(cè)試集。輸入層采用藥物劑量、失血量、生命體征等46個(gè)特征變量。并測(cè)試了一個(gè)多任務(wù)學(xué)習(xí)模型,該模型被用于綜合預(yù)測(cè)每種并發(fā)癥的可能性。而后將人工神經(jīng)網(wǎng)絡(luò)模型與傳統(tǒng)ASA評(píng)分進(jìn)行比較。結(jié)果顯示,各項(xiàng)目中預(yù)測(cè)效果最好的神經(jīng)網(wǎng)絡(luò)模型在各個(gè)方面均優(yōu)于ASA評(píng)分。預(yù)測(cè)AKI效果最優(yōu)模型的AUC為0.792,預(yù)測(cè)再插管效果最優(yōu)模型的AUC為0.879,預(yù)測(cè)死亡率效果最優(yōu)模型的AUC為0.907,綜合預(yù)測(cè)并發(fā)癥效果最優(yōu)模型的AUC為0.874。該實(shí)驗(yàn)顯示,使用人工神經(jīng)網(wǎng)絡(luò)可以建立預(yù)測(cè)效果優(yōu)于傳統(tǒng)ASA評(píng)分的預(yù)測(cè)模型。
2.1.1 多層感知器(MLP) MLP是一種多層前饋人工神經(jīng)網(wǎng)絡(luò),可以將輸入的多個(gè)數(shù)據(jù)集映射在單一的輸出數(shù)據(jù)集上,多采用乙形函數(shù)作為激活函數(shù)。Cao等[6]采用斯堪的納維亞肥胖手術(shù)登記(SOReg)的患者數(shù)據(jù)構(gòu)建基于MLP、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、RNN 3種人工神經(jīng)網(wǎng)絡(luò)的術(shù)后并發(fā)癥風(fēng)險(xiǎn)預(yù)測(cè)模型。訓(xùn)練集采用2010~2014年在SOReg中注冊(cè)登記的37 811例患者數(shù)據(jù),測(cè)試集采用2015年的6 250例患者數(shù)據(jù)。輸入層采用患者年齡、糖化血紅蛋白、BMI、WC、手術(shù)年份5個(gè)連續(xù)特征和性別、睡眠呼吸暫停等11個(gè)二元特征。輸出結(jié)果為是否在術(shù)后30天內(nèi)出現(xiàn)Clavien-Dindo分級(jí)中3b級(jí)以上的嚴(yán)重術(shù)后并發(fā)癥??紤]到嚴(yán)重術(shù)后并發(fā)癥的低發(fā)生率(3.2%),采用合成少數(shù)類過(guò)采樣技術(shù)(SMOTE)生成一個(gè)SMOTE數(shù)據(jù)集用于訓(xùn)練,以解決數(shù)據(jù)類別不平衡問(wèn)題。結(jié)果顯示,采用SMOTE數(shù)據(jù)集訓(xùn)練后的三類人工神經(jīng)網(wǎng)絡(luò)AUC均有所提升,其中MLP模型的性能最為理想,AUC從0.60提升至0.84;CNN模型的效果與之相似,AUC從0.58提升至0.79;而RNN模型的最高AUC僅為0.65,未能達(dá)到預(yù)期值。但在測(cè)試集中,三類模型測(cè)試集的AUC均明顯低于訓(xùn)練集,顯示神經(jīng)網(wǎng)絡(luò)存在明顯的過(guò)擬合,這可能是因?yàn)镾OReg中缺乏部分重要的圍術(shù)期特征,可以從其他數(shù)據(jù)庫(kù)中提取更多患者特征加以改進(jìn)。He等[7]提出了一種基于改良MLP的肺癌術(shù)后風(fēng)險(xiǎn)并發(fā)癥預(yù)測(cè)模型,稱為醫(yī)學(xué)多層感知器(MediMLP),并且將MediMLP和Grad-CAM算法在一個(gè)共享模型中同時(shí)執(zhí)行,使得該模型可以同時(shí)執(zhí)行預(yù)測(cè)患者是否會(huì)有術(shù)后并發(fā)癥的二元分類任務(wù)和發(fā)生何種術(shù)后并發(fā)癥的三元分類任務(wù)。輸入數(shù)據(jù)集采用華西醫(yī)院胸外科8 459例術(shù)后患者的電子病歷(EMRs),輸入層采用患者姓別、年齡、手術(shù)史等72個(gè)特征變量。使用真實(shí)分布率(TPR)、F1、AUC和精度(ACC)作為二元分類的指標(biāo),結(jié)果表明,MediMLP各項(xiàng)指標(biāo)均優(yōu)于傳統(tǒng)MLP。使用微TPR、微F1和漢明損失作為多標(biāo)簽分類的評(píng)估指標(biāo),將Grad-CAM與其他特征選擇方法做比較,Grad-CAM的三項(xiàng)指標(biāo)結(jié)果為0.618、0.602、0.053,顯示出良好的特征提取性能,并發(fā)現(xiàn)留置引流管時(shí)間是影響術(shù)后并發(fā)癥的首要關(guān)鍵特征。但由于數(shù)據(jù)集不夠大,導(dǎo)致提取的關(guān)鍵特征變量過(guò)少,無(wú)法全面評(píng)估影響術(shù)后并發(fā)癥的因素??紤]到PCP通常使用X線圖像,可以嘗試通過(guò)X線圖像將肺癌PCP的MediMLP擴(kuò)展到CNN。
2.1.2 CNN CNN是一種含有卷積計(jì)算的具有深層結(jié)構(gòu)的多層神經(jīng)網(wǎng)絡(luò)。這種模型可把特征提取、下采樣和傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)整合起來(lái),直接使用圖像像素進(jìn)行特征變量的識(shí)別分析[3]。Wei等[8]構(gòu)建了基于CNN的PET-CT監(jiān)測(cè)模型,用于監(jiān)測(cè)非小細(xì)胞肺癌(NSCLC)患者術(shù)后肺炎病毒感染風(fēng)險(xiǎn)。輸入集采用120例NSCLC患者的病例特征,將患者隨機(jī)分為A組(CT)、B組(PET-CT)、C組(基于人工神經(jīng)網(wǎng)絡(luò)模型的PET-CT)、D組(基于CNN模型的PET-CT診斷),每組30例,并進(jìn)行感染監(jiān)測(cè)。結(jié)果表明,基于CNN模型的PET-CT圖像識(shí)別的準(zhǔn)確率(ACC)、敏感度和特異性分別為99.31%、100%和98.31%。D組患者手術(shù)傷口感染率和肺部感染率分別為6.54%和15.38%,低于其他三組(P<0.05)。A組、B組、C組、D組患者術(shù)后并發(fā)癥發(fā)生率分別為32.4%、30.2%、28.75和8.7%,由此可見,基于CNN模型的PET-CT圖像在NSCLC患者術(shù)后肺炎病毒感染監(jiān)測(cè)中具有較好的準(zhǔn)確性、敏感度和特異性,可有效預(yù)防患者肺部和手術(shù)傷口感染,提高患者術(shù)后恢復(fù)效果。但由于樣本量過(guò)少,該模型缺乏代表性。Rouzrokh等[9]構(gòu)建了一個(gè)CNN模型以評(píng)估全髖關(guān)節(jié)置換術(shù)(THA)后髖關(guān)節(jié)脫位風(fēng)險(xiǎn)。該模型采用13 970例原發(fā)性THA患者在5年隨訪期間的影像學(xué)表現(xiàn),包括1 490張脫位THA的X線片。訓(xùn)練CNN目標(biāo)檢測(cè)模型(YLO-V3),以股骨頭為中心裁剪圖像。訓(xùn)練ResNet18分類器,以根據(jù)裁剪成像預(yù)測(cè)隨后的髖關(guān)節(jié)脫位。ResNet18分類器使用ImageNet權(quán)重初始化,并使用PyTorch上運(yùn)行的FastAI(V1.0)進(jìn)行訓(xùn)練。該模型平均性能(標(biāo)準(zhǔn)偏差)準(zhǔn)確度為49.5(4.1%),敏感度為89.0(2.2%),特異性為48.8(4.2%),陽(yáng)性預(yù)測(cè)值為3.3(0.3%),陰性預(yù)測(cè)值為99.5(0.1%),AUC為0.767(3.6%),顯示該模型最重視股骨頭和髖臼組件。該模型具有較好的敏感度和陰性預(yù)測(cè)值,有助于臨床醫(yī)生基于影像預(yù)測(cè)模型判斷術(shù)后髖關(guān)節(jié)脫位風(fēng)險(xiǎn)。Ye等[10]基于CNN和偏移特征(MF),在深度偏移特征算法下進(jìn)行超聲圖像引導(dǎo)肝癌微波消融效果研究。構(gòu)建了一種新的超聲圖像診斷算法CNNMF,記錄術(shù)后消融點(diǎn)、并發(fā)癥及消融時(shí)間。與基于主成分分析(PCA)和反向傳播(BP)的AdaBoost和PCA-BP算法比較準(zhǔn)確度、特異性、敏感度,并計(jì)算了3種算法的F1值。CNNMF算法的4項(xiàng)數(shù)據(jù)分別為96.31%、89.07%、91.26%和0.79%,明顯大于AdaBoost和PCA-BP算法。與傳統(tǒng)算法相比,CNNMF算法對(duì)肝癌超聲圖像具有更好的診斷性能。Zheng等[11]建立CNN模型對(duì)MRI和CT圖像進(jìn)行處理,然后對(duì)圖像信息進(jìn)行統(tǒng)計(jì)分析,探究基于深度學(xué)習(xí)的CT和MRI圖像在肝癌介入治療評(píng)價(jià)中的作用。深度學(xué)習(xí)模型處理后的MRI和CT圖像增強(qiáng)區(qū)域的殘差情況分割效果較好,能準(zhǔn)確顯示病變的存在,診斷效率在0.7以上。Zhu等[12]建立了基于CNN的術(shù)后股骨頭壞死的風(fēng)險(xiǎn)預(yù)測(cè)模型。利用X線平片混合患者變量開發(fā)的深度學(xué)習(xí)方法,使用術(shù)后盆腔X線片和輸出回歸X線片變量訓(xùn)練了CNN模型?;旌狭芯€圖基于患者和X線片變量來(lái)確定預(yù)測(cè)性能,與單獨(dú)的臨床方法相比,神經(jīng)網(wǎng)絡(luò)提升了列線圖的臨床價(jià)值。Yoon等[13]依據(jù)AO/OTA分類方法,建立基于神經(jīng)網(wǎng)絡(luò)的CT圖像自動(dòng)多分類股骨粗隆間斷裂檢測(cè)模型。根據(jù)骨折位置對(duì)原始CT圖像進(jìn)行調(diào)整和重排,并應(yīng)用非銳化掩蔽濾波器。使用快速區(qū)域CNN(R-CNN)對(duì)9種不同類型的IT骨折和無(wú)骨折進(jìn)行多分類,同時(shí)采用貝葉斯優(yōu)化方法來(lái)確定最優(yōu)的超參數(shù)值。該研究提出的自動(dòng)多分類IT股骨骨折檢測(cè)模型可以讓臨床醫(yī)生更快、更準(zhǔn)確地識(shí)別骨折區(qū)域,診斷不同類型的股骨骨折。Elhage等[14]使用常規(guī)術(shù)前影像的神經(jīng)網(wǎng)絡(luò)模型從369例患者和9 303張圖像中開發(fā)并驗(yàn)證了3個(gè)神經(jīng)網(wǎng)絡(luò)模型。計(jì)算每個(gè)模型的AUC、準(zhǔn)確度、敏感度和特異性并進(jìn)行比較。結(jié)果顯示,手術(shù)復(fù)雜性預(yù)測(cè)模型AUC為0.744,感染預(yù)測(cè)模型AUC為0.898,性能較好,且手術(shù)復(fù)雜性風(fēng)險(xiǎn)預(yù)測(cè)模型較專家醫(yī)生更準(zhǔn)確;預(yù)測(cè)術(shù)后肺衰竭的模型AUC為0.545,效果較差。說(shuō)明基于術(shù)前常規(guī)成像構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)模型可較好地預(yù)測(cè)腹壁重建手術(shù)的復(fù)雜性和術(shù)后感染情況。顯然,CNN在圖像分析方面擁有獨(dú)特優(yōu)勢(shì),但由于身體結(jié)構(gòu)影像具有復(fù)雜性和多變性,模型需要學(xué)習(xí)大量的影像圖片。
2.1.3 BP神經(jīng)網(wǎng)絡(luò) BP神經(jīng)網(wǎng)絡(luò)是基于誤差反向算法的多層前饋網(wǎng)絡(luò),其核心是梯度下降法[15]。Xu等[16]構(gòu)建了一個(gè)基于BP神經(jīng)網(wǎng)絡(luò)的胃腸道腫瘤手術(shù)后疲勞(POF)的風(fēng)險(xiǎn)預(yù)測(cè)模型。輸入數(shù)據(jù)集采用598例患者數(shù)據(jù),POF總發(fā)生率為58.7%,其中463個(gè)樣本用于訓(xùn)練集。輸入層采用Logistic回歸篩選的7個(gè)特征變量共19個(gè)單元,包括腫瘤分期、社會(huì)支持等。該模型的敏感度為88.60%,特異性為74.87%,AUC為0.892[95%CI(0.860,0.919)],預(yù)測(cè)性能優(yōu)于Logistic回歸和分類回歸樹(CART)模型。
2.2 RNN Rank等[17]利用RNN對(duì)術(shù)后AKI進(jìn)行預(yù)測(cè),且能夠在癥狀出現(xiàn)之前預(yù)測(cè)術(shù)后AKI。在常規(guī)采集96個(gè)參數(shù)的基礎(chǔ)上,建立了用于心肺術(shù)后AKI實(shí)時(shí)預(yù)測(cè)的RNN。訓(xùn)練集從15 564個(gè)數(shù)據(jù)中挑選2 224個(gè),獨(dú)立測(cè)試集為350個(gè)患者數(shù)據(jù)。得出AUC為0.893[95%CI(0.862,0.924)]。但獨(dú)立測(cè)試集的數(shù)據(jù)過(guò)少,評(píng)估結(jié)果還有待驗(yàn)證。Wang等[18]建立了嵌入式電子病歷(EMR)信息知識(shí)體系,收集8個(gè)臨床科室首頁(yè)的患者病歷和疾病診斷代碼數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析。采用自然語(yǔ)言處理-雙向遞歸神經(jīng)網(wǎng)絡(luò)(NLP-BIRNN)算法對(duì)病歷進(jìn)行優(yōu)化。將BIRNN與CNN和RNN在準(zhǔn)確度、癥狀準(zhǔn)確率和癥狀回憶率方面進(jìn)行了比較,表明該神經(jīng)網(wǎng)絡(luò)具有較高的價(jià)值。改良的RNN可以對(duì)EMR數(shù)據(jù)進(jìn)行預(yù)處理,包括數(shù)據(jù)處理、清理和篩選。NLP-BIRNN的準(zhǔn)確度、癥狀準(zhǔn)確率和癥狀回憶率均優(yōu)于CNN和未優(yōu)化RNN模型。
2.3 結(jié)合特殊特征變量篩選及分類的人工神經(jīng)網(wǎng)絡(luò) 特征變量篩選可以剔除無(wú)意義的臨床指征分析,減少神經(jīng)網(wǎng)絡(luò)的過(guò)擬合,同時(shí)利于模型更準(zhǔn)確地指出各關(guān)鍵因素對(duì)并發(fā)癥的影響程度。Farrokhi等[19]建立了4個(gè)基于ANNs的深部腦刺激手術(shù)(DBS)術(shù)后并發(fā)癥預(yù)測(cè)模型。輸入數(shù)據(jù)集采自501例接受DBS手術(shù)患者。采用Logistic回歸分析評(píng)價(jià)危險(xiǎn)因素,特征變量包括年齡、性別、BMI、臨床診斷、吸煙史、免疫抑制、高血壓(手術(shù)后90天內(nèi)服用藥物)、糖尿病診斷、手術(shù)靶點(diǎn)(VIM、STN、GPi)和手術(shù)側(cè)(左、右、雙側(cè))。采用SMOTE平衡數(shù)據(jù)類別,采用中位數(shù)插補(bǔ)法處理連續(xù)變量缺失值。最佳模型在預(yù)測(cè)任何并發(fā)癥(AUC 0.86)、12個(gè)月內(nèi)的并發(fā)癥(AUC 0.91)、返回手術(shù)室(AUC 0.88)和感染(AUC 0.97)時(shí)表現(xiàn)出較高的辨別能力。并分析出年齡、體質(zhì)指數(shù)、手術(shù)側(cè)、性別和帕金森病的診斷是有影響的特征。Mai等[20]也建立了一個(gè)結(jié)合Logistic回歸分析識(shí)別自變量的神經(jīng)網(wǎng)絡(luò)模型,以預(yù)測(cè)接受半肝切除術(shù)的肝細(xì)胞癌患者后嚴(yán)重肝衰竭風(fēng)險(xiǎn)。輸入數(shù)據(jù)集為353例患者數(shù)據(jù),輸入層采用血小板計(jì)數(shù)、凝血酶原時(shí)間、總膽紅素、天門冬氨酸轉(zhuǎn)氨酶和標(biāo)準(zhǔn)化的未來(lái)肝臟殘存量5個(gè)特征變量,訓(xùn)練集AUC為0.880[95%CI(0.836,0.925)],測(cè)試集AUC為0.876[95%CI(0.801,0.950)],顯示了良好的擬合效果和性能,有助于外科醫(yī)生識(shí)別中高危風(fēng)險(xiǎn)。但以上兩種模型的樣本量均過(guò)小,需要在更多臨床數(shù)據(jù)訓(xùn)練下進(jìn)一步驗(yàn)證模型性能。
Han等[21]構(gòu)建了一個(gè)帶遞歸特征消除(RFE)算法的神經(jīng)網(wǎng)絡(luò),用于預(yù)測(cè)胰十二指腸切除術(shù)術(shù)后胰瘺(POPF)的發(fā)生率。RFE是一種特征選擇方法,用于識(shí)別最終神經(jīng)網(wǎng)絡(luò)模型中使用的特征子集,該方法去除關(guān)聯(lián)最弱的特征變量,直到達(dá)到最大AUC。輸入數(shù)據(jù)集采集自三星醫(yī)療中心的1 769例接受胰十二指腸切除術(shù)患者,輸入層采用手術(shù)前血清C反應(yīng)蛋白、淀粉酶、脂肪酶和糖類抗原(CA)等38個(gè)特征變量,采用中位數(shù)插補(bǔ)法處理連續(xù)變量缺失值。未使用RFE算法的神經(jīng)網(wǎng)絡(luò)模型AUC為0.71,使用RFE算法后AUC提升至0.74。通過(guò)AI算法確定了16個(gè)POPF的危險(xiǎn)因素:胰管直徑、體質(zhì)指數(shù)、術(shù)前血清白蛋白、脂肪酶水平、術(shù)中輸液量、年齡、血小板計(jì)數(shù)、胰腺外腫瘤位置、聯(lián)合靜脈切除、合并胰腺炎、新輔助放療、美國(guó)麻醉醫(yī)師協(xié)會(huì)評(píng)分、性別、胰腺軟組織、潛在心臟病和術(shù)前內(nèi)鏡膽道減壓。該應(yīng)用程序已免費(fèi)發(fā)放于網(wǎng)絡(luò)平臺(tái),可用于選擇需要特別強(qiáng)化治療的患者,并在術(shù)前制定有效的治療策略。
將輸入數(shù)據(jù)集進(jìn)行術(shù)前、術(shù)中、術(shù)后數(shù)據(jù)分類,可以獨(dú)立判斷不同類別的數(shù)據(jù)是否有利于預(yù)測(cè)性能。Xue等[22]建立了邏輯回歸、支持向量機(jī)、隨機(jī)森林、梯度增強(qiáng)樹(GBT)和深度神經(jīng)網(wǎng)絡(luò)(DNN)5種機(jī)器學(xué)習(xí)模型用于預(yù)測(cè)AKI、譫妄、深靜脈血栓形成(DVT)、肺栓塞(PE)和肺炎5種術(shù)后并發(fā)癥的風(fēng)險(xiǎn)。輸入數(shù)據(jù)集采集自111 888例患者,分為術(shù)前和術(shù)中兩個(gè)數(shù)據(jù)集,并將特征變量分為54個(gè)術(shù)前變量和16個(gè)術(shù)中變量。采用固定值插補(bǔ)法等多種方法處理缺失數(shù)據(jù),并測(cè)試缺失數(shù)據(jù)集對(duì)于模型預(yù)測(cè)性能的影響。DNN模型對(duì)于PE的預(yù)測(cè)效果最好,AUC為0.831[95%CI(0.824,0.839)]。僅使用術(shù)前數(shù)據(jù)集的預(yù)測(cè)性能優(yōu)于僅使用術(shù)中數(shù)據(jù)集的預(yù)測(cè)性能;聯(lián)合數(shù)據(jù)集對(duì)所有并發(fā)癥的預(yù)測(cè)性能最好。然而,僅使用術(shù)前數(shù)據(jù)集的模型表現(xiàn)幾乎相同。聯(lián)合數(shù)據(jù)集和術(shù)前數(shù)據(jù)集之間的AUC差值:肺炎為0.019,AKI為0.032,DVT為0.016,PE為0.009,譫妄為0.002,可見術(shù)中數(shù)據(jù)集對(duì)于模型的預(yù)測(cè)性能影響較小。當(dāng)添加輸入數(shù)據(jù)缺失的變量時(shí),不同輸出結(jié)果的模型AUC均有一定程度的增加。Bhandari等[23]建立了一個(gè)神經(jīng)網(wǎng)絡(luò)模型用于預(yù)測(cè)影響患者術(shù)后恢復(fù)的手術(shù)中事件(IOE)和手術(shù)后事件(POE)。該模型包含兩個(gè)密集層,每個(gè)密集層后有一個(gè)dropout層,以防止網(wǎng)絡(luò)的過(guò)擬合,密集層采用整流線性單元(ReLU)進(jìn)行非線性激活,輸出層采用Sigmoid激活函數(shù),使用Adam優(yōu)化器對(duì)所有模型進(jìn)行訓(xùn)練以最小化函數(shù)損失。輸入數(shù)據(jù)集采集自Vattikuti集體質(zhì)量倡議(VCQI)中接受機(jī)器人輔助的腎部分切除術(shù)患者。IOE發(fā)生率為5.62%,POE發(fā)生率為20.98%。IOE預(yù)測(cè)模型使用1 690例患者和38個(gè)特征變量的數(shù)據(jù)構(gòu)建;最佳模型AUC為0.858 [95%CI(0.762,0.936)],PR-AUC為0.590[95%CI(0.400,0.759)]。使 用1 406例 患 者和59個(gè)變量的數(shù)據(jù)對(duì)預(yù)測(cè)模型進(jìn)行訓(xùn)練;最佳模型AUC為0.875[95%CI(0.834,0.913)],PR-AUC為0.706[95%CI(0.610,0.790)]。該模型可以預(yù)測(cè)影響患者術(shù)后恢復(fù)效果的術(shù)中和術(shù)后操作,通過(guò)模型的隱含層設(shè)計(jì)較好地解決過(guò)擬合問(wèn)題,未來(lái)可以在大量數(shù)據(jù)的訓(xùn)練下進(jìn)一步提升擬合性能。
許多神經(jīng)網(wǎng)絡(luò)模型在術(shù)后并發(fā)癥的預(yù)測(cè)中有良好的擬合效果,AUC可達(dá)0.7以上,基于不同算法的神經(jīng)網(wǎng)絡(luò)模型在不同領(lǐng)域各有優(yōu)勢(shì),為臨床研究提供了多樣化的選擇。研究者可以在單一神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上加以改進(jìn)和融合,使得預(yù)測(cè)工具的適用范圍更廣。但是,缺乏足夠的訓(xùn)練集數(shù)據(jù)進(jìn)行學(xué)習(xí)、存在過(guò)擬合現(xiàn)象、缺乏臨床實(shí)踐檢驗(yàn)等問(wèn)題尚存在于現(xiàn)有模型中。輸入數(shù)據(jù)的缺失,以及不恰當(dāng)?shù)臉?biāo)準(zhǔn)化處理是過(guò)擬合的主要原因。采用SMOTE技術(shù)可有效解決癥狀發(fā)生率過(guò)低而導(dǎo)致的數(shù)據(jù)類別不平衡,插補(bǔ)法可用于處理連續(xù)變量的缺失值。Logistic回歸可分析結(jié)局事件的獨(dú)立影響因素[24],RFE算法可以識(shí)別關(guān)聯(lián)性弱的特征變量,輸入層使用篩選后的特征變量,可以減少模型的過(guò)擬合,提高模型的擬合效果。也可優(yōu)化設(shè)計(jì)模型隱含層,如嘗試使用不同的隱含層數(shù),使用dropout層等。此外,建立人工神經(jīng)網(wǎng)絡(luò)對(duì)于編碼人員的要求較高,編碼人員對(duì)主要診斷選擇和疾病分類編碼都會(huì)影響模型的性能。人工神經(jīng)網(wǎng)絡(luò)模型的建立與完善有助于制定更合理的治療方案和術(shù)后護(hù)理措施。醫(yī)生可根據(jù)不同??频氖中g(shù),在相應(yīng)模型研究的基礎(chǔ)上,綜合考慮相關(guān)影響因素,選擇最優(yōu)神經(jīng)網(wǎng)絡(luò)模型,避免高危因素,以降低患者發(fā)生術(shù)后并發(fā)癥的概率,減輕患者痛苦。