張燕,彭伶麗,梁玲玲,羅貞
病情惡化指患者經(jīng)歷的一種損害血流動力學穩(wěn)定性的動態(tài)變化過程,以生理失代償為特征,伴或不伴有主觀感覺異?;蚩陀^參數(shù)異常[1]。臨床住院過程中存在著大量的潛在危重患者[2]。該類患者如果不早期識別及干預,有可能在短期內(nèi)病情迅速惡化,從而發(fā)生嚴重的不良結(jié)局事件[3],如心臟驟停、非預期死亡等。嚴重不良事件的發(fā)生不僅給患者及家屬帶來巨大打擊,同時也增加醫(yī)院負擔,容易導致醫(yī)療糾紛。護士與患者接觸頻繁,在病情觀察與治療中發(fā)揮著重要的作用。如果患者的病情惡化沒有被及時識別,將造成不恰當?shù)淖o理或干預延遲[4]。
為幫助護士早期識別患者的病情惡化,國外學者構(gòu)建了多種基于患者生理參數(shù)的病情預警系統(tǒng),如早期預警評分(Early Warning Score,EWS)[5],改良早期預警評分(Modified Early Warning Score,MEWS)[6],國家早期預警評分(National Early War-ning Score,NEWS)[7]等。盡管病情預警評分得到廣泛的應用,但仍然存在不足,如評估工具包含的生理參數(shù)有限,且多是單一時點的評分,缺乏連續(xù)性,不能全面反映患者病情變化趨勢等。而數(shù)據(jù)挖掘技術(shù)的興起及其在病情識別方面的應用在很大程度上解決了上述難題。本研究對數(shù)據(jù)挖掘技術(shù)在病情惡化早期識別中的應用進展及問題進行綜述,旨在為護理工作提供啟示和參考。
隨著醫(yī)院信息系統(tǒng)的普及,產(chǎn)生了大量的醫(yī)療健康數(shù)據(jù)。醫(yī)療領(lǐng)域的數(shù)據(jù)挖掘(Data Mining,DM)是從大量、不完全、有噪聲的、模糊的、隨機的醫(yī)療健康數(shù)據(jù)信息中挖掘潛在的、有效的信息,從中找出有意義的關(guān)系、模式和趨勢等的過程[8],涉及統(tǒng)計學、數(shù)學、機器學習方法、人工智能、數(shù)據(jù)可視化等多種技術(shù)。數(shù)據(jù)挖掘的實現(xiàn)依賴多種數(shù)據(jù)挖掘方法,應用于病情惡化早期識別中的數(shù)據(jù)挖掘算法有邏輯回歸(Logistic Regression,LR)、貝葉斯(Bayesian Network,BN)、決策樹模型(Decision Tree Model,DTM)、隨機森林(Random Forest,RF)、人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)和支持向量機(Support Vector Model,SVM)等機器學習方法。
1.1邏輯回歸 邏輯回歸是一種研究因變量為二分類(可擴展到多分類)變量與多個影響因素(自變量)之間關(guān)系的非線性回歸方法,通過篩選有意義的自變量建立模型,根據(jù)模型預測在不同的自變量情況下,發(fā)生某病或某種情況的概率[9]。
1.2貝葉斯 貝葉斯定理最初由英國學者Thomas Bayes提出,而后被發(fā)展應用為一種統(tǒng)計推斷方法,其基本方法是將樣本信息與未知參數(shù)的先驗信息結(jié)合,依據(jù)貝葉斯定理得出后驗信息后進行統(tǒng)計推斷[10]。其計算公式為P(A|B)=P(B|A)P(A)/P(B),P(A|B)是在B發(fā)生的情況下A發(fā)生的概率。根據(jù)先驗概率P(A)和條件概率P(B|A)最終得到后驗概率P(A|B)。如已知某種疾病的發(fā)病率P(A),有一種檢驗技術(shù)診斷此病的誤診率為5%,假設(shè)一個人的檢驗結(jié)果顯示有病,推測這個人確實患病的概率(后驗概率)。
1.3決策樹模型 決策樹是主要用于解決分類問題的數(shù)據(jù)挖掘算法,它是一種類似樹形結(jié)構(gòu)的流程圖,一棵決策樹一般包括一個根節(jié)點、若干個內(nèi)部節(jié)點和葉節(jié)點。其中每個內(nèi)部節(jié)點表示一個屬性上的判斷,每個分支代表一個判斷結(jié)果的輸出,最后每個葉節(jié)點代表一種分類結(jié)果[11]。如根據(jù)Braden評分(根節(jié)點)、翻身計劃的落實情況和皮膚損傷情況及有無促進壓力性損傷發(fā)生的特殊情況(內(nèi)部節(jié)點)篩選難免性壓力性損傷的高?;颊?葉節(jié)點)[12]。其目的是從中挑選出最有意義的分類變量和分類數(shù),形成簡單易讀的分類規(guī)則。
1.4隨機森林 隨機森林是將多個決策樹整合成一個分類器的集成算法[13],不同的決策樹構(gòu)成森林。當進行分類時,新的輸入樣本進入,就讓森林中的每個決策樹進行判斷和分類,每個決策樹會生成一個分類結(jié)果,將分類結(jié)果進行匯總,哪種分類結(jié)果最多便挑選其作為最終的分類結(jié)果。
1.5人工神經(jīng)網(wǎng)絡(luò) 人工神經(jīng)網(wǎng)絡(luò)是一種應用類似大腦神經(jīng)元突觸聯(lián)接的結(jié)構(gòu)進行信息處理的數(shù)學模型,由大量的節(jié)點(或稱神經(jīng)元)之間相互聯(lián)接構(gòu)成,包括輸入層、隱含層和輸出層。輸入層接受外部世界的信號與數(shù)據(jù);經(jīng)過隱含層、輸出層的計算得到預測值,預測值為輸出層的輸出結(jié)果[14]。
1.6支持向量機 支持向量機是20世紀90年代中期由Vapnik等[15]根據(jù)結(jié)構(gòu)風險最小化理論提出的一種二分類模型,其基本思想是利用核函數(shù)將輸入向量映射到一個高維的特征向量空間,并在該特征空間中構(gòu)造最優(yōu)分類面[16],以正確劃分訓練數(shù)據(jù)集區(qū)分不同類別的樣本。
2.1幫助醫(yī)護人員識別潛在危重患者,減少嚴重不良事件發(fā)生 由于ICU床位的數(shù)量限制,部分被轉(zhuǎn)入到普通病房的潛在危重患者容易因監(jiān)護不到位、臨床決策失誤等原因而造成嚴重的不良事件[17]。據(jù)報道,因病情惡化未被識別使患者轉(zhuǎn)入ICU延遲、需要接受心肺復蘇所致的病死率高達67%[18]。早期識別潛在危重患者,對減少嚴重不良事件、改善患者臨床結(jié)局意義重大[19]。Ghosh等[20]收集11 362例普通病房患者的生命體征,使用樸素貝葉斯算法形成了病情惡化早期預警指標評分(Early Deterioration Indicator,EDI)用于識別死亡或需轉(zhuǎn)入ICU或過渡ICU(Progressive Care Unit,PCU)的患者,結(jié)果發(fā)現(xiàn)該評分比常用的MEWS評分、NEWS評分的預測準確性更高,且發(fā)現(xiàn)病情惡化的時間從惡化前7 h提前至惡化前24 h。另有研究顯示,利用多層感知器神經(jīng)網(wǎng)絡(luò)對普通病區(qū)的患者發(fā)生非計劃性轉(zhuǎn)入ICU進行預測,該模型能將預測窗口提前至轉(zhuǎn)ICU前的16 h[21]。這類預警模型能較好地預測普通病房患者嚴重不良結(jié)局的發(fā)生,從而有助于護理人員對可能發(fā)生不良事件的高危人群實施積極干預,降低致殘率、病死率等[22]。
2.2幫助醫(yī)護人員尋找病情惡化的早期預警指標 病情惡化的預警指標即預測患者發(fā)生病情惡化的預測因子,通常為與病情惡化相關(guān)的各種臨床變量。數(shù)據(jù)挖掘技術(shù)通過從眾多臨床變量中遴選有意義的變量建立預警模型,能幫助醫(yī)護人員尋找病情惡化的危險因素,輔助臨床決策。Churpek等[23]回顧了269 999例住院患者的人口學資料、實驗室檢查及生命體征數(shù)據(jù),比較不同數(shù)據(jù)挖掘算法建立的預警模型預測心臟驟停、非計劃轉(zhuǎn)ICU和死亡的準確性,結(jié)果發(fā)現(xiàn)隨機森林模型的預測準確性最高,其中呼吸頻率、心率、年齡、收縮壓是模型中最重要的預測變量。Zhai等[24]運用邏輯回歸方法從36個臨床變量(包括生命體征、意識水平、疼痛、呼吸做功)中篩選出29個變量,建立兒童非計劃轉(zhuǎn)ICU的預警模型,結(jié)果顯示該模型的預測效能較現(xiàn)有的兒童早期預警評分[25]更佳。模型中早期預警指標異常對患者的病情惡化有著指示作用,是護士進行病情觀察的重要指標。
2.3評估疾病嚴重程度,預測ICU住院病死率 ICU患者多為器官或系統(tǒng)功能衰竭的危重患者,可同時患有多種疾病,并發(fā)癥的發(fā)生率和病死率極高[26]。患者醫(yī)療費用高,護士的工作量大,通過評估患者病情嚴重程度和死亡風險能避免過度治療,同時提升護士處理危重患者突發(fā)事件的應對能力,提高ICU住院患者的總體生存率[27]。
近年來,學者們相繼開發(fā)了多種基于數(shù)據(jù)挖掘技術(shù)的ICU死亡預警模型。謝俊卿等[28]基于國外的大型重癥醫(yī)療數(shù)據(jù)庫MIMIC-Ⅲ(Medical Information Mart for Intensive Care),提取第二代簡化急性生理評分模型(Simplified Acute Physiology Score,SAPS-Ⅱ)[29]中的17個變量,應用隨機森林算法建立ICU患者住院死亡風險預測模型,發(fā)現(xiàn)其曲線下面積高達0.855,其預測的準確性較高,這與Ng等[30]的研究結(jié)果一致。潘昌霖等[31]收集來自心臟、內(nèi)外科及創(chuàng)傷等ICU的4 000例患者的生理生化數(shù)據(jù),運用貝葉斯算法建立ICU患者住院病死率的預測模型,該模型包含體溫、呼吸、心率、收縮壓及血糖、白蛋白等共25個變量,結(jié)果顯示其能很好地區(qū)分出住院死亡的患者。綜上,利用數(shù)據(jù)挖掘算法建立的預警模型可能比常用的病情評分工具預測ICU病死率更準確,能幫助護理人員對患者病情作出正確評價,從而加強對危重患者的監(jiān)測和實施緊急干預,提高患者的生存率。
2.4幫助急診醫(yī)護人員進行分流,保證急診運營效率 急診科就診的患者病情嚴重程度不一,優(yōu)先救治危重患者,避免醫(yī)療資源浪費,評估患者病情以合理分診,是急診科工作的重要環(huán)節(jié),也是緩解急診科擁擠現(xiàn)象,減少漏診和誤診,避免醫(yī)療糾紛的關(guān)鍵。Ong等[32]以心臟驟停和死亡為結(jié)局事件,收集925例急診科患者的前瞻性隊列數(shù)據(jù),以患者入院72 h內(nèi)心臟驟停和死亡為預測結(jié)局,利用支持向量機算法形成基于心率變異性指標、年齡、生命體征的預測評分系統(tǒng),以最佳截斷值作為臨界點,通過計算得分將急診患者分為低、中、高危組。根據(jù)這一風險分層工具,護士能區(qū)分不同風險的心臟驟停和死亡患者,從而進行合理分流,在醫(yī)療資源有限的條件下指導優(yōu)先救治危重患者,使醫(yī)療資源利用最大化。
2016年,國務院印發(fā)的《“健康中國2030”規(guī)劃綱要》提出要加強醫(yī)療大數(shù)據(jù)應用體系建設(shè),推進醫(yī)療健康大數(shù)據(jù)開放共享、深度挖掘和廣泛應用[33]。但目前國內(nèi)醫(yī)療數(shù)據(jù)挖掘還處于起步階段,且存在較多問題。
3.1自身條件限制
3.1.1許多預警模型基于國外人群,外推性較差,未進行臨床應用 許多數(shù)據(jù)挖掘算法建立的預警模型依賴國外人群的數(shù)據(jù)集,存在人種差異,能否應用于國內(nèi)的目標人群存在爭議;大多數(shù)研究是基于回顧性的數(shù)據(jù)集開展的單中心研究,存在數(shù)據(jù)缺失、記錄錯誤等問題,模型的外推性較差;同時,關(guān)于模型效能驗證的前瞻性研究較少,沒有進行實際的臨床應用。因此醫(yī)護人員在選擇使用此類預警模型時應謹慎,今后有必要開展多中心、前瞻性的研究對模型的效能進行驗證。
3.1.2某些模型中預警指標的權(quán)重未知,不能指導提供針對性的護理措施 依靠傳統(tǒng)算法如邏輯回歸建立的模型能明確知道模型中每個指標的權(quán)重,而某些數(shù)據(jù)挖掘算法如神經(jīng)網(wǎng)絡(luò)方法、隨機森林算法是一個黑匣子(BlackBox)[34-35],得出的結(jié)論無法進行解釋,只能作為軟件應用程序來運行以達到預測的目的。由于可解釋性差,護理人員無法知曉需要著重干預的影響因素,不能為實施針對性護理措施提供指導。
3.2客觀條件限制
3.2.1護理記錄未標準化導致數(shù)據(jù)處理困難 護理記錄是護理病歷的重要組成部分,目前國內(nèi)各個醫(yī)療機構(gòu)內(nèi)部及醫(yī)療機構(gòu)之間對于護理記錄的書寫沒有統(tǒng)一標準。護理記錄存在數(shù)據(jù)缺失、表達不清、未包含某些數(shù)據(jù)如交班記錄、壓瘡的圖片等問題[36],給數(shù)據(jù)處理造成了很大困難。為此明尼蘇達大學護理學院舉辦了利用大數(shù)據(jù)和科學改變醫(yī)療共識會議,旨在推進電子病歷中標準化護理術(shù)語的整合[37]。因此實現(xiàn)護理信息共享,有必要由相關(guān)組織牽頭開展類似活動,同時借鑒國際上現(xiàn)存的標準化護理術(shù)語集來發(fā)展符合中國國情的標準化護理術(shù)語集,推動護理術(shù)語逐步實現(xiàn)標準化。
3.2.2缺乏管理和開發(fā)大型臨床數(shù)據(jù)集的專業(yè)人員 數(shù)據(jù)挖掘算法非常復雜,需要計算機技術(shù)的輔助。臨床醫(yī)護人員具備豐富的專業(yè)知識和實踐經(jīng)驗,但對于數(shù)據(jù)挖掘方法、計算機技術(shù)等并不精通,因此還需培養(yǎng)精通護理信息學方面的專業(yè)人才或者與專業(yè)人士協(xié)作。國外的護理信息學教育起源于20世紀80年代后期,英美等發(fā)達國家陸續(xù)開設(shè)了護理信息學專業(yè)課程[38]。我國的護理信息學教育才剛起步,今后應在本科、研究生課程中加入護理信息學的課程,培養(yǎng)精通護理與信息學的復合人才,推動臨床護理、護理科研、護理教育的發(fā)展。
3.2.3實時處理和分析數(shù)據(jù)存在缺陷 早期預警需要護理人員動態(tài)的、連續(xù)的監(jiān)測,從而實時了解其病情變化趨勢,提高預測的準確性[39]。Hackmann等[40]采用電子病歷系統(tǒng)和實時傳感器系統(tǒng)來識別病情惡化,具體流程包括無線傳感器網(wǎng)絡(luò)將患者實時的生命體征數(shù)據(jù)導入到電子病歷系統(tǒng)中,不良事件監(jiān)測裝置分析導入的數(shù)據(jù)并在患者出現(xiàn)病情變化時自動通知醫(yī)護人員。彭伶麗等[41]將MEWS評分表植入到電子病歷系統(tǒng)中,護士輸入生命體征數(shù)值后系統(tǒng)可自動計算MEWS分值,但缺少關(guān)于自動監(jiān)測和通知系統(tǒng)的報道。開發(fā)信息系統(tǒng)以實現(xiàn)床旁監(jiān)測設(shè)備數(shù)據(jù)向電子病歷系統(tǒng)的實時傳輸,將預警模型嵌入電子病歷系統(tǒng)評估患者的病情,將是未來研究的重點和難點。
病情惡化的早期識別是管理臨床危重癥患者或潛在危重患者的有效手段,通過早期的風險感知,幫助醫(yī)護人員在病情惡化早期采取針對性的治療護理,從而減少住院嚴重不良結(jié)局事件的發(fā)生,維護患者安全,降低醫(yī)療成本。
多種數(shù)據(jù)挖掘技術(shù)被應用于病情惡化早期識別的模型構(gòu)建中,且顯示了較高的準確性,但目前缺少對此類模型的效能驗證以及與傳統(tǒng)病情評估工具的比較分析,今后有必要開展多中心、前瞻性的研究驗證模型的有效性。護理記錄術(shù)語尚未實現(xiàn)標準化,護理信息教育學還處于起步階段,阻礙了數(shù)據(jù)挖掘技術(shù)在醫(yī)療數(shù)據(jù)中的發(fā)展,應在借鑒國外先進經(jīng)驗的基礎(chǔ)上建立適合我國國情的標準化護理記錄術(shù)語集,大力開展護理信息學教育。另外,數(shù)據(jù)挖掘還有賴醫(yī)學、統(tǒng)計學、計算機科學等學科的交叉和融合,開發(fā)人工智能化系統(tǒng)進行實時數(shù)據(jù)處理和分析將是未來的研究方向,有助于醫(yī)護人員更精準地預測病情發(fā)展趨勢、輔助臨床決策,維護患者安全。