袁 歡,彭小玉,肖菊花,景奕瑄,張慧霞
1.湖南中醫(yī)藥大學(xué)護理學(xué)院,湖南 410208;2.湖南省中醫(yī)藥研究院附屬醫(yī)院
意識障礙(disorders of consciousness,DOC)由中樞神經(jīng)系統(tǒng)受損導(dǎo)致個體感知能力出現(xiàn)障礙的一種神經(jīng)系統(tǒng)疾病[1]。臨床上根據(jù)評估病人的意識障礙程度來確定可行性治療,醫(yī)務(wù)人員通過量表評估病人并調(diào)整治療措施,從而促進病人意識恢復(fù)。據(jù)調(diào)查,美國每年意識障礙病人的總數(shù)約42萬例,我國每年新增意識障礙病人約10萬例[2]。研究表明長期處于意識障礙的病人容易并發(fā)肺部感染、肺積水、陣發(fā)性交感神經(jīng)興奮等并發(fā)癥,導(dǎo)致治療周期延長,醫(yī)療資源消耗增加,因此盡早評估意識障礙有利于病人預(yù)后,減輕醫(yī)療負擔(dān)[3]。目前在臨床上應(yīng)用的意識障礙評估量表有格拉斯哥昏迷評分(Glasgow Coma Scale,GCS)、格拉斯哥匹茲堡昏迷評分(Glasgow-Pittsburgh Come Scale,GCS-P)、全面無反應(yīng)性量表(Full Outline of UnResponsiveness Score,F(xiàn)OUR)、反應(yīng)水平量表(Reaction Level Scale,RLS)等。最常使用的評估量表是GCS量表,但是隨著疾病發(fā)展多元化,而GCS無法評估語言反應(yīng),因此建立人工氣道的病人在語言功能上存在明顯的盲區(qū),為了彌補GCS的缺點,F(xiàn)OUR量表被發(fā)明出來后逐漸在臨床上應(yīng)用。陶鵬飛[4]的研究表明FOUR量表擁有略高于經(jīng)典權(quán)威GCS評分的可信度和有效性,唐秋月等[5]也得到相似的結(jié)論,對于腦卒中合并意識障礙病人的預(yù)后恢復(fù)情況,F(xiàn)OUR量表預(yù)測的準(zhǔn)確性以及辨別力可能更好。目前,已有多項前瞻性研究評估了FOUR量表在意識障礙中的預(yù)測價值,但由于納入研究對象、樣本量、量表臨界值等不同,研究結(jié)果也不盡相同。此外數(shù)據(jù)庫中沒有關(guān)于FOUR量表的診斷Meta分析,與劉振興等[6]在2018年發(fā)表的Meta分析相比,本研究檢索時間跨度更長,病人數(shù)量更大、納入的前瞻隊列研究更多,其結(jié)果更具有說服性。本研究通過使用MetaDisc 1.4軟件對大量數(shù)據(jù)進行Meta分析,以評估FOUR量表對意識障礙病人院內(nèi)死亡預(yù)測的有效性,以期為臨床工作者選擇有效的意識障礙評估工具提供依據(jù)。
計算機檢索中國知網(wǎng)(CNKI)、萬方數(shù)據(jù)庫(WanFang Database)、中國生物醫(yī)學(xué)文獻服務(wù)系統(tǒng)(SinoMed)、中國生物醫(yī)學(xué)文獻數(shù)據(jù)庫(CBM)、PubMed、MedLine Complete、the Cochrane Library數(shù)據(jù)庫,檢索時間為建庫至2022年2月1日,無語言限制,也包括未出版的灰色文獻,其檢索網(wǎng)站為http://www.opengrey.eu/。中文檢索詞為:全面無反應(yīng)性量表、意識障礙、昏迷、危險評估、診斷、預(yù)測。英文檢索詞為:Full Outline of UnResponsiveness score、consciousness、coma、risk assessment、diagnosis、predictive,并通過手工檢索和文獻溯源以避免文獻漏檢。
1.2.1 納入標(biāo)準(zhǔn)
①研究對象:出現(xiàn)意識障礙的病人,無病種、年齡限制;②干預(yù)措施:使用FOUR量表進行評估;③結(jié)局指標(biāo):院內(nèi)死亡率;④研究類型:前瞻性隊列研究,意識障礙中有明確的分級和界定標(biāo)準(zhǔn),總分為0~16分;⑤觀察指標(biāo):敏感度、特異度、陽性似然比、陰性似然比、診斷比值比和總受試者工作特征(summary receiver operating characteristic,SROC)曲線下面積(area under curve,AUC)。
1.2.2 排除標(biāo)準(zhǔn)
橫斷面研究、動物實驗研究、文獻綜述、重復(fù)的研究、方法學(xué)不全的研究、數(shù)據(jù)資料不全的研究以及無法提取四格表數(shù)據(jù)的研究。
由2名研究者根據(jù)納入和排除標(biāo)準(zhǔn)獨立地對文獻進行篩選、提取然后匯總。如遇不同意見交由第3名研究者評判,遵從少數(shù)服從多數(shù)原則。資料提取包括作者、研究國家(地區(qū))、研究時間、納入研究對象的年齡、性別、院內(nèi)死亡例數(shù)、樣本量、FOUR量表的臨界值以及FOUR量表預(yù)測的結(jié)局指標(biāo)敏感度、特異度、真陰性數(shù)(true negative,TN)、真陽性數(shù)(true positive,TP)、假陰性數(shù)(false negative,F(xiàn)N)、假陽性數(shù)(false positive,F(xiàn)P),必要時通過郵箱聯(lián)系作者獲得數(shù)據(jù)。
由2名評價者根據(jù)診斷性研究質(zhì)量評價工具的評價標(biāo)準(zhǔn)對納入的文獻進行質(zhì)量評價。本研究采用的評價工具是Quality Assessment of Diagnostic Accuracy Studies-2(QUADAS-2),其包括病例選擇、待評價的診斷試驗、金標(biāo)準(zhǔn)、病例流程和診斷實驗與金標(biāo)準(zhǔn)間隔的時間。每個條目對應(yīng)的評價為“是”“不清楚”“否”。在偏倚風(fēng)險層次為“高”“低”“不清楚”。由2名評價者對納入的文獻逐條進行評價,如遇不同意見則由第3方介入,遵從少數(shù)服從多數(shù)原則。本研究所納入的文獻質(zhì)量均較高,無剔除的文獻。
對納入文獻進行數(shù)據(jù)提取,構(gòu)建2×2四格表,并采用 MetaDisc 1.4軟件進行Meta分析。通過I2檢驗評估異質(zhì)性,以P<0.05為差異有統(tǒng)計學(xué)意義。當(dāng)I2<25%表示研究間存在低度異質(zhì)性;I2在25%~70%則研究間存在中等程度異質(zhì)性;I2>70%則研究間存在高度異質(zhì)性[7]。根據(jù)異質(zhì)性檢驗結(jié)果選擇隨機效應(yīng)模型或固定效應(yīng)模型(I2<50%采用固定效應(yīng)模型,I2≥50%采用隨機效應(yīng)模型),根據(jù)異質(zhì)性結(jié)果來確定是否存在閾值效應(yīng),計算靈敏度對數(shù)與(1-特異度)對數(shù)的Spearman相關(guān)系數(shù)評估閾值效應(yīng),如不存在閾值效應(yīng),則提取類別進行亞組分析并探討異質(zhì)性的來源。最后合并效應(yīng)值,包括敏感性、特異性、合并陽性似然比、合并陰性似然比、診斷比值比及各自的95%置信區(qū)間(CI)。繪制SROC曲線并計算AUC的面積(0.5 初步檢索到1 615篇相關(guān)文獻,經(jīng)過逐項閱讀文獻題目、摘要或全文,排除重復(fù)發(fā)表、綜述、不符合納入標(biāo)準(zhǔn)、無法提取四格表的研究,最終納入23篇文獻[9-31],均為前瞻性研究。其中20篇英文文獻,3篇中文文獻,共納入病例2 531例。文獻篩選流程圖及結(jié)果見圖1。 圖1 文獻篩選流程及結(jié)果 表1 納入文獻的基本特征 使用QUADAS-2工具對文獻質(zhì)量進行評價,通過RevMan 5.3軟件進行偏倚分析,見圖2。 圖2 文獻質(zhì)量風(fēng)險評價比例圖 結(jié)果顯示,應(yīng)用FOUR量表預(yù)測院內(nèi)死亡率敏感度的23篇研究間存在中度異質(zhì)性(I2=68.2%,P<0.000 1),故采用隨機效應(yīng)模型。結(jié)果顯示:合并敏感度為0.80[95%CI(0.76,0.83)],見圖3。應(yīng)用FOUR量表預(yù)測院內(nèi)死亡率合并特異度為0.84[95%CI(0.83,0.86)],見圖4。應(yīng)用FOUR量表預(yù)測院內(nèi)死亡率合并陽性似然比為4.97[95%CI(4.04,6.12)],見圖5。應(yīng)用FOUR量表預(yù)測院內(nèi)死亡率合并陰性似然比為0.24[95%CI(0.19,0.31)],見圖6。應(yīng)用FOUR量表預(yù)測院內(nèi)死亡率合并診斷比值比為23.82[95%CI(17.06,33.26)],見圖7。SROC曲線下面積AUC為0.90(SE為0.01),見圖8。 圖3 FOUR量表預(yù)測院內(nèi)死亡率的合并敏感度森林圖 圖4 FOUR量表預(yù)測院內(nèi)死亡率的合并特異度森林圖 圖5 FOUR量表預(yù)測院內(nèi)死亡率的合并陽性似然比森林圖 圖6 FOUR量表預(yù)測院內(nèi)死亡率的合并陰性似然比森林圖 圖7 FOUR量表預(yù)測院內(nèi)死亡率的合并診斷比值比森林圖 圖8 FOUR量表預(yù)測院內(nèi)死亡率的SROC曲線 根據(jù)合并敏感度、特異度、陽性似然比、陰性似然比的分析結(jié)果將敏感性差異較大的研究[15,22,26,28]剔除后再進行Meta分析,敏感性不變,說明納入文獻的穩(wěn)定性較好,但是異質(zhì)性明顯降低,說明文獻的異質(zhì)性很大程度來源于這4篇研究間的差異。見圖9。 圖9 去除4項差異較大研究后合并敏感度森林圖 根據(jù)數(shù)據(jù)分析顯示23項研究間存在中度異質(zhì)性。此外,研究表明閾值效應(yīng)不是引起該研究異質(zhì)性的主要原因(r=0.262<0.6即不存在閾值效應(yīng)),這可能與未達到最佳樣本量有關(guān)。結(jié)果表明,異質(zhì)性可能來源于研究對象間差異,由于疾病的特殊性,出現(xiàn)意識障礙多見于重癥病人,除了無法獲取數(shù)據(jù)的病人,只要符合納入標(biāo)準(zhǔn)幾乎全部納入,同時也不存在不適當(dāng)?shù)呐懦龢?biāo)準(zhǔn)。所有病人都使用FOUR量表,沒有干預(yù)方式的差異,因此來源于臨床異質(zhì)性的原因較低。另外,所有研究均采用前瞻性隊列研究,因果證明關(guān)系較可靠,根據(jù)結(jié)局指標(biāo)顯示不需要隨訪,因此異質(zhì)性來源于方法學(xué)可能性也不高。但是,各研究間還是存在發(fā)表偏倚風(fēng)險,因為病人無意識,無法接受一個相同的金標(biāo)準(zhǔn),此外,由于樣本量偏少,也可能存在結(jié)果的偶然性。 意識是一種動態(tài)過程,喚醒和意識的相對組成部分可能在短時間內(nèi)波動,而意識障礙病人無法說出自身疾病的變化,因此,醫(yī)務(wù)人員及時評估病人的病情變化極為重要[32]?,F(xiàn)如今有很多醫(yī)療器械可以評估病人意識變化,如神經(jīng)電生理技術(shù)、誘發(fā)電位、腦成像技術(shù),但是,昏迷量表作為快捷和最簡便的基礎(chǔ)評價工具,在各項診療基礎(chǔ)上是不可替代的。在昏迷量表評估中使用最多的是GCS,以熟悉性占有統(tǒng)治優(yōu)勢,但是實際上,GCS暴露的缺點越來越無法忽視,F(xiàn)OUR量表作為一種新的評估量表,彌補了GCS的缺點。但是關(guān)于這2種評分系統(tǒng)中哪一個具有最佳預(yù)測價值仍然存在沖突。其中在遠程醫(yī)療評估中GCS的表現(xiàn)優(yōu)于FOUR量表[33],這與之前的面對面評估相反,這可能與機器人遠程醫(yī)療采用了高清攝像頭、變焦和平移-俯仰技術(shù),并調(diào)整了環(huán)境照明條件有關(guān),然而事實證明,遠程判斷腦干,尤其是瞳孔反應(yīng)是具有一定挑戰(zhàn)性的。但是總的來說遠程醫(yī)療評估可用于改善危重病人的早期評估的缺陷,消除不確定性并幫助建立遠程醫(yī)療昏迷評估。但是也有研究表明FOUR量表在評估腦死亡前期更為準(zhǔn)確,研究指出使用FOUR量表和GCS評估腦死亡前期都是可行的,但是FOUR量表可能更為有效,因為FOUR量表結(jié)合了瞳孔、角膜和咳嗽反射,因此更容易評估病人的自主呼吸[26]。根據(jù)大量文獻顯示FOUR量表已經(jīng)應(yīng)用于腦卒中、自發(fā)性蛛網(wǎng)膜下腔出血、肝性腦病等疾病領(lǐng)域中,且對兒童的意識障礙評估同樣有效。此外,對于預(yù)測院內(nèi)死亡的臨界值也存在眾多爭議,但是本研究通過數(shù)據(jù)分析得出臨界值不是引起閾值效應(yīng)的直接因素。陳璇等[14]認(rèn)為FOUR量表評估院內(nèi)死亡的最佳臨界值為7分,并且大多數(shù)研究也將7分作為評估院內(nèi)死亡的臨界值,但是在Marcati等[13]研究中將10分作為院內(nèi)死亡的臨界值,并且其敏感性和特異性分別為91%和86%,對比將7分作為臨界值的其他研究的敏感性和特異性都比較高,這可能與Marcati等[13]的研究樣本量較少,且未考慮評估者間一致性有關(guān),因為該研究只有醫(yī)生進行評估,在意大利只有醫(yī)生擁有評估法律價值,而其他研究考慮了評估者間一致性,因此具有差異性。綜上所述,本研究對23篇文獻中2 531例病人進行了Meta分析,以確定FOUR量表對意識障礙病人院內(nèi)死亡危險預(yù)測的有效性。結(jié)果顯示FOUR量表對意識障礙的預(yù)測合并敏感度為0.80,合并特異度為0.84,AUC為0.90,提示FOUR評估量表預(yù)測院內(nèi)死亡的有效性較強,具有較強的診斷意義。 剔除4篇較大差異的文獻后敏感性無明顯降低,但是異質(zhì)性由原來的68.2%下降至27.1%。分析后得出,首先與Chen等[15]研究對象的疾病嚴(yán)重程度有關(guān),該研究共納入101例病人,其中80例病人都存在嚴(yán)重的創(chuàng)傷性腦損傷,表明FOUR量表在預(yù)測微弱神經(jīng)狀態(tài)效果更佳,因此預(yù)測嚴(yán)重意識障礙病人效能更強。其次,該研究將4分作為預(yù)測院內(nèi)死亡的臨界值,與其他研究中的臨界值相差較大,說明預(yù)測院內(nèi)死亡率可能還與臨界值有關(guān)。Saika等[22]的研究對象也是較少的輕微創(chuàng)傷性腦損傷病人,并且納入對象只為ICU病人,存在較大的發(fā)表偏倚,此外,該研究并沒有考慮評估者間的一致性,表明這些均是影響FOUR量表評估意識障礙病人的因素。Zappa等[26]的研究對象也是腦損傷病人,并且都在ICU住院超過24 h,研究對象意識障礙程度也較重,此外,該研究對象樣本偏少,只有40例,也存在較大的發(fā)表偏倚。Hosseini等[25]的研究中考慮了評估者間的一致性,結(jié)果顯示預(yù)測院內(nèi)死亡的敏感性為100%,但是FOUR量表預(yù)測院內(nèi)死亡的特異性僅為62%,但是FOUR量表預(yù)測不良結(jié)局的特異性為92%,表明FOUR量表在區(qū)分病人存活的能力較低,區(qū)分不良結(jié)局的能力較強。 根據(jù)RevMan 5.3軟件進行偏倚分析顯示本研究納入的文獻質(zhì)量均較高,這可能與納入的研究均為前瞻性研究,其次與評估者都是具有一定年限的醫(yī)務(wù)人員有關(guān),同時FOUR量表可以明顯區(qū)分病人的意識狀態(tài),可靠性較強。但由于納入的文獻樣本量不夠多,這與疾病種類和無法獲取研究對象的資料有關(guān),由于研究對象的特殊性,有的研究未嚴(yán)格按照非隨機對照試驗設(shè)計,因此對結(jié)果會產(chǎn)生一定的偏倚。 因本研究納入的各研究間存在不同程度的異質(zhì)性,在一定程度上說明FOUR量表作為單獨指標(biāo)對意識障礙病人的預(yù)測有效性還存在一定的局限性。盡管研究發(fā)現(xiàn)FOUR量表在預(yù)測院內(nèi)死亡顯示出較強的敏感性和特異性,并且可以通過應(yīng)用于不同的研究對象來提高其預(yù)測的有效性。但也不能一味地尊崇新出現(xiàn)的評估量表,在不同病人、不同情況上應(yīng)該合理地選擇有效的評估量表,同時臨床護理人員要積極嘗試評價意識障礙病人的評估工具,以期為病人提供更有效的優(yōu)質(zhì)護理服務(wù),改善現(xiàn)有意識障礙風(fēng)險評估工具的不足。2 結(jié)果
2.1 文獻檢索結(jié)果
2.2 納入文獻的基本特征(見表1)
2.3 納入文獻的質(zhì)量風(fēng)險評價
2.4 Meta分析
2.5 敏感性分析
2.6 異質(zhì)性分析
3 討論
3.1 FOUR量表應(yīng)用的意義
3.2 敏感性分析
3.3 文獻質(zhì)量分析
4 小結(jié)