李昆鵬 李國宏 陳進(jìn)霞 吳郊鋒 趙曉丹
譫妄是老年患者術(shù)后常見的并發(fā)癥之一,研究顯示,65歲及以上患者術(shù)后譫妄的發(fā)生率為5%~50%,而急診手術(shù)患者的譫妄發(fā)生率更高,可高達(dá)36%[1]。譫妄患者易產(chǎn)生相關(guān)并發(fā)癥進(jìn)而引起不良預(yù)后,影響患者生活質(zhì)量[2]。早期預(yù)防可以使住院患者譫妄的發(fā)生率下降30%~40%[3],但是研究顯示,缺乏有效的篩查工具是阻礙譫妄早期識別的主要因素之一[4-6]。斯坦福譫妄評估量表 (Stanford Proxy Test for Delirium,S-PTD)是斯坦福大學(xué)2015年開發(fā)的譫妄篩查量表。國外研究顯示其相較于其他的譫妄評估量表優(yōu)點(diǎn)如下[7-8]:該量表依據(jù)譫妄診斷金標(biāo)準(zhǔn)DSM-5(the fifth edition of the Diagnostic and Statistical Manual of Mental Disorders)開發(fā);條目適中、評估方法簡便,平均評估時間1~2分鐘,尤其適用于人員編制少、工作節(jié)奏快的外科病房使用;臨床情境中靈敏度高(80.72%~82.7%)、特異度高(90.37%~95.3%);量表適用范圍廣,可用于內(nèi)、外科住院患者,重癥患者(包括因機(jī)械輔助通氣交流不便或病情原因不合作的患者);考慮到譫妄病情波動的特點(diǎn),該量表評估時機(jī)是在結(jié)束值班前,護(hù)士對該班次時間段內(nèi)患者病情的評估,評估更全面,避免了漏診。而目前我國尚無該量表引進(jìn)報(bào)道。因此,本研究漢化該量表并進(jìn)行文化調(diào)適,建立中文版S-PTD并在我國胃腸外科手術(shù)患者中評價(jià)其信度、效度。
1.1.1 原量表介紹
S-PTD是斯坦福大學(xué)2015年開發(fā)的譫妄篩查量表。原量表在普通病房的臨床情境中敏感度為82.7%,特異度為95.3%[7],共包含13個條目,未做詳細(xì)維度劃分。該量表為他評、觀察性量表,護(hù)士在經(jīng)過8~12小時值班后,根據(jù)值班期間跟患者(家屬)的互動、觀察的結(jié)果進(jìn)行評分。量表采用Likert 3級評分法評分,前12個條目“經(jīng)?!庇?jì)2分,“偶爾”計(jì)1分,“從不”計(jì)0分;第13個條目為年齡:“>70歲”計(jì)2分,“56~70歲”計(jì)1分,“≤55歲”計(jì)0分。所有條目都采用正向計(jì)分,≥3分考慮譫妄陽性。
1.1.2 量表的翻譯與回譯
獲得原作者授權(quán)后,采用Brislin模型[9]對S-PTD進(jìn)行漢化。邀請2名有歐洲留學(xué)經(jīng)歷的醫(yī)學(xué)博士獨(dú)立正向翻譯量表,研究小組將2份翻譯稿進(jìn)行對比、整合,討論合并成為中文版1稿;再邀請1名大學(xué)英語教師、1名熟練掌握英語讀寫的護(hù)理專業(yè)研究生,在沒有閱讀過原英文版問卷的情況下對中文版進(jìn)行回譯,課題組將回譯版與原量表進(jìn)行對比,對不同之處再次調(diào)整,直至中文版與原量表內(nèi)容基本相同且表述符合我國文化要求。
1.1.3 文化調(diào)適
文化調(diào)適過程嚴(yán)格按照Guillemin等[10]提出的保持原量表與目標(biāo)語量表跨文化等價(jià)性,從語義等價(jià)、習(xí)語等價(jià)、經(jīng)驗(yàn)等價(jià)、概念等價(jià)4個方面進(jìn)行評價(jià),文化調(diào)適小組由多學(xué)科人員組成,且包含雙語背景專家。本研究采用了現(xiàn)場小組會議法對量表進(jìn)行文化調(diào)適,邀請9名專家對中文版S-PTD進(jìn)行評議,包括胃腸外科、精神科主治醫(yī)師各1名,重癥醫(yī)學(xué)科、神經(jīng)內(nèi)科、精神科主管護(hù)師5名及護(hù)理學(xué)教授2名。文化調(diào)適小組與量表的翻譯者、回譯者和綜合者共同討論以使每一處差異均達(dá)成一致,形成中文版2稿。
1.1.4 預(yù)實(shí)驗(yàn)
采用便利抽樣法,選取入住南京市某綜合性三級甲等醫(yī)院胃腸外科的患者30例進(jìn)行預(yù)實(shí)驗(yàn)。納入標(biāo)準(zhǔn):18~85歲;擬行胃腸外科手術(shù)(預(yù)期手術(shù)時間>2小時)。排除標(biāo)準(zhǔn):術(shù)前存在認(rèn)知障礙、有精神分裂癥或精神病史、存在視聽障礙或不能用普通話交流;實(shí)際手術(shù)時間≤2小時;患者或家屬不同意參與研究。脫落標(biāo)準(zhǔn):撤回知情同意書,要求退出實(shí)驗(yàn)的患者;失訪、轉(zhuǎn)院或死亡者;因其他原因由研究者中止實(shí)驗(yàn)者。問卷填寫結(jié)束后記錄填表所需時間及意見[11]。根據(jù)調(diào)查結(jié)果和專家組的意見,形成最終的中文版量表。
1.2.1 研究對象
2021年10月至2022年9月,采用便利抽樣法選取入住南京市某綜合性三級甲等醫(yī)院胃腸外科的患者為研究對象。根據(jù)量表?xiàng)l目數(shù)的5~10倍確定樣本量[12]。本量表共13個條目,故量表信度、效度檢驗(yàn)至少需要樣本量130例。胃腸外科手術(shù)患者術(shù)后譫妄發(fā)生率高于20%,根據(jù)靈敏度和特異度估算樣本量方法[8],另考慮樣本脫落10%,估計(jì)檢驗(yàn)靈敏度及特異度所需的樣本量應(yīng)不少于315例。故本研究共需樣本量至少445例。所有研究對象自愿參與本研究,并簽署知情同意書。
1.2.2 研究工具
研究工具包括:①一般資料調(diào)查表,由研究者根據(jù)研究目的并結(jié)合文獻(xiàn)自行設(shè)計(jì),包括姓名、住院號、年齡、性別、入院診斷、手術(shù)名稱、手術(shù)時長等;②中文版S-PTD,供護(hù)士使用;③DSM-5,供精神科醫(yī)生使用。
1.2.3 資料收集方法
患者入院后24小時內(nèi)完成入組篩選。術(shù)后5天內(nèi),由經(jīng)過培訓(xùn)考核的護(hù)士使用中文版S-PTD在每班結(jié)束時評估1次,當(dāng)日患者任一時段出現(xiàn)譫妄則判定其為陽性。精神科醫(yī)生采用DSM-5對患者過去24小時病情做判斷,考慮到譫妄病情的波動性,醫(yī)生診斷在護(hù)士評估后2小時內(nèi)進(jìn)行,每日1次。醫(yī)護(hù)人員相互不知曉評估結(jié)果,評估持續(xù)到患者出院或在院死亡。
1.2.4 質(zhì)量控制
制訂中文版S-PTD使用說明,實(shí)驗(yàn)前對資料收集護(hù)士進(jìn)行統(tǒng)一培訓(xùn)、考核,經(jīng)考核合格后方可進(jìn)行實(shí)驗(yàn)。由研究者本人每日收集評估后的量表。調(diào)查結(jié)果雙人雙機(jī)錄入,為保證問卷的有效性,如量表13個條目缺失1項(xiàng)以上或該患者全部條目缺失20%及以上視為無效問卷。
1.2.5 倫理原則
本研究已通過東南大學(xué)附屬中大醫(yī)院臨床研究倫理委員會的審查(批件號:2021ZDSYLL247-P01);向入組的患者及家屬說明研究的目的及意義,征得同意后簽署知情同意書,確?;颊呋蚣覍僮栽竻⑴c實(shí)驗(yàn);保護(hù)患者的隱私,研究結(jié)果僅限于本研究使用,不涉及其自身權(quán)益、不影響其正常診療。
1.2.6 信度、效度檢驗(yàn)方法
1.2.6.1 效度檢驗(yàn)
采用內(nèi)容效度指數(shù)(Content Validity Index,CVI)評價(jià)量表內(nèi)容效度[13]。采用電子郵件的形式選取9名經(jīng)驗(yàn)豐富的譫妄領(lǐng)域的專家對本量表的各條目與所需測量概念的相關(guān)程度做出評價(jià)。其中“1”代表該條目與研究內(nèi)容一點(diǎn)都不相關(guān),“4”代表該條目與研究內(nèi)容非常相關(guān)。I-CVI(Item-level CVI)的計(jì)算方法是以單個條目為單位,計(jì)算評分為“3”或“4”的專家數(shù)除以專家總數(shù)的結(jié)果,而S-CVI(Scale-level CVI)的計(jì)算方式是測定所有I-CVI的平均值。當(dāng)I-CVI值≥0.78,S-CVI值≥0.90時即可認(rèn)為量表具有較好的內(nèi)容效度[14]。通過收集專家意見,對條目的內(nèi)容與表達(dá)方式進(jìn)行適當(dāng)修改。采用探索性因子分析檢驗(yàn)量表的結(jié)構(gòu)效度。采用主成分分析法和最大方差正交旋轉(zhuǎn)法進(jìn)行探索性因子分析。
1.2.6.2 信度檢驗(yàn)
(1)內(nèi)部一致性:通過計(jì)算Cronbach’sα系數(shù),Guttman折半信度和Spearman重測信度來評價(jià)量表的信度。量表的Cronbach’sα系數(shù)>0.80,各維度Cronbach’sα系數(shù)>0.6,折半信度和重測信度>0.7,則認(rèn)為量表信度良好[15]。
(2)評定者間信度:選擇經(jīng)過培訓(xùn)、考核的2名研究護(hù)士每日日間對相同患者使用中文版S-PTD獨(dú)立完成評估1次,評估持續(xù)至術(shù)后第5天。比較2名研究護(hù)士評估的一致性,計(jì)算Kappa值評價(jià)評估者間信度[15]。
1.2.7 統(tǒng)計(jì)學(xué)方法
采用SPSS 22.0軟件對資料進(jìn)行統(tǒng)計(jì)分析,計(jì)量資料采用均數(shù)±標(biāo)準(zhǔn)差描述,計(jì)數(shù)資料采用頻數(shù)、構(gòu)成比、率描述。量表的效度采用內(nèi)容效度和結(jié)構(gòu)效度進(jìn)行評價(jià);信度通過Cronbach’sα系數(shù)和Guttman折半信度評價(jià)內(nèi)部一致性,用Kappa值評價(jià)評估者間信度,使用Spearman重測信度評價(jià)量表的穩(wěn)定性。以DSM-5為金標(biāo)準(zhǔn),根據(jù)受試者工作特征曲線(ROC)下面積(AUC),靈敏度、特異度和約登指數(shù)評估中文版S-PTD診斷譫妄的性能。以P<0.05為差異有統(tǒng)計(jì)學(xué)意義。
本研究共入組492例患者,有效樣本量為458例,有效回收率為93.09%。其中男299例(65.28%),女159例(34.72%);年齡(63.97±12.77)歲;胃惡性腫瘤145例(31.66%),腸道惡性腫瘤205例(44.76%),胃部良性疾病16例(3.49%),腸道良性疾病92例(20.09%);胃全切除手術(shù)107例(23.36%),胃大部切除手術(shù)52例(11.35%),腸切除手術(shù)299例(65.28%),其中腸造口19例。
本研究根據(jù)專家意見及預(yù)調(diào)查過程中的反饋意見對量表做了相應(yīng)的修改,具體如下。①文化調(diào)試過程中考慮國情,家屬往往要求醫(yī)護(hù)人員對患者隱瞞病情,條目2旨在判斷患者的意識和定向力,故專家建議將條目2B“他/她的病情如何”改為“與現(xiàn)陪護(hù)人員的關(guān)系”;此外,將條目2C中內(nèi)容“忘記主要團(tuán)隊(duì)成員的身份或角色”修改為“忘記了管床醫(yī)生和責(zé)任護(hù)士是誰”;將條目5C內(nèi)容“學(xué)習(xí)使用新的醫(yī)院設(shè)備(如吸痰器)”修改為“學(xué)習(xí)使用新的醫(yī)院設(shè)備(如尿壺、拐杖、輪椅、呼叫器、床欄)”;條目6A內(nèi)容為“在與護(hù)理團(tuán)隊(duì)或家人討論護(hù)理選擇時,難以合理地處理信息”,考慮我國護(hù)理人員及家人照顧的主要內(nèi)容為飲食、喂水等,為了使評估內(nèi)容更清晰、明確,此項(xiàng)修改為“簡單進(jìn)食種類、是否飲水抉擇困難”。②專家內(nèi)容效度評價(jià)過程中,根據(jù)收集的專家意見,對條目的語意與表達(dá)方式進(jìn)行適當(dāng)修改,如條目1C中“填寫菜單”改為“填寫表單”;條目3B中“忘記訪客、食物、生活秩序等”修改為“忘記探陪人員、用餐等日常事務(wù)”;條目4C中“對簡單的問題做出含糊的回答”修改為“對簡單的常識性問題不能作準(zhǔn)確回答”;條目5A中“了解他病情的新信息”修改為“對常規(guī)飲食/活動指導(dǎo)等不能理解、配合”。條目13為年齡評分,與其他條目相關(guān)性差,專家建議將該條目作為獨(dú)立因素考量。
護(hù)士使用修改版中文S-PTD進(jìn)行評估,平均完成問卷時間為1~2分鐘。研究者與參與護(hù)士共同討論量表的使用體會,根據(jù)反饋意見將條目7A中“找不到他/她的餐盤嗎?”修改為“難以定位視線范圍內(nèi)的物品,如抽紙或手機(jī)等”。形成中文版S-PTD量表終稿。
2.4.1 內(nèi)容效度
首輪專家函詢I-CVI值為0.67~1.00,其中條目13為年齡評分,與病情無關(guān),專家內(nèi)容效度評分為0.67,經(jīng)研究小組評議,該條目暫保留,作為獨(dú)立因素考量。第二輪I-CVI值為0.78~1.00,S-CVI值為0.95,具有較好的內(nèi)容效度。
2.4.2 結(jié)構(gòu)效度
探索性因子分析結(jié)果顯示,KMO值為0.813,Bartlett’s球形檢驗(yàn)值χ2=1886.474(P<0.001),表明該量表適合做因子分析。采取主成分分析法和最大方差旋轉(zhuǎn)法進(jìn)行分析,設(shè)置特征值>1,對公因子進(jìn)行提取[16]。共提取3個公因子,累計(jì)方差貢獻(xiàn)率為59.368%,旋轉(zhuǎn)后各條目因子載荷詳見表1。
?
2.4.3 信度
本量表納入13個條目的Cronbach’sα系數(shù)為0.769,刪除條目13后量表總的Cronbach’sα系數(shù)為0.827。刪除條目13后量表各因子的Cronbach’sα系數(shù)為0.726~0.741。量表Guttman折半信度為0.738,Spearman重測信度為0.783。本研究中評估者間信度共完成了21例患者的評估,回收有效量表210份,計(jì)算Kappa值為0.981。
458例患者中發(fā)生譫妄的有87例,發(fā)生率為19.0%。根據(jù)診斷結(jié)果,當(dāng)量表診斷閾值為2.5時,約登指數(shù)最大為0.613,此時靈敏度為0.678,特異度為0.935。繪制ROC曲線,計(jì)算曲線下面積為0.853(95%CI:0.801~0.905,P<0.05),見圖1。因?qū)嶋H工作中量表評分為整數(shù),當(dāng)更注重靈敏度,避免漏診時可取最佳閾值為2;當(dāng)更注重特異度時可取最佳閾值為3。
護(hù)士作為患者的全天候照顧者,對患者病情變化信息獲取更加及時、全面,因此在譫妄早期識別中護(hù)士起到重要的作用[17]。但因大部分普通外科病房護(hù)士數(shù)量少、工作量大,阻礙了術(shù)后譫妄的評估[18],中文版S-PTD作為觀察性量表,在護(hù)士8小時工作后,根據(jù)患者本班時段的情況進(jìn)行評分,完成測試一般僅需1~2分鐘,未增加護(hù)士工作量且同時考慮了患者短時間內(nèi)癥狀的波動,不易造成漏診[8]。德國Nydahl等[19]的研究和我國一項(xiàng)針對外科病房的術(shù)后譫妄評估現(xiàn)狀調(diào)查[20]均顯示:量表評估過程煩瑣,護(hù)士譫妄相關(guān)知識不足是影響譫妄評估的重要因素。目前,護(hù)士對譫妄評估的依從性和準(zhǔn)確性均不能滿足臨床要求[18-20],急需一個評估簡便、有效、易于掌握的評估量表以供護(hù)士使用。本研究在量表引進(jìn)過程中嚴(yán)格按照Brislin模型進(jìn)行,逐條翻譯并根據(jù)我國文化適當(dāng)調(diào)整條目內(nèi)容,使之更適合我國患者使用。中文版S-PTD條目數(shù)適中,評估內(nèi)容是患者日常言行、情緒、睡眠狀態(tài)等,評估結(jié)果簡單、易獲得。因本研究在量表評價(jià)過程中,研究者嚴(yán)密追蹤患者入組及評估情況,故未評價(jià)護(hù)士評估的依從性。但本研究共入組492例患者,有效樣本量為458例,有效回收率為93.09%。樣本脫落的原因?yàn)槭中g(shù)時間不足2 h排除24例、轉(zhuǎn)科數(shù)據(jù)不全3例、當(dāng)日拒絕4例、術(shù)中診斷不符合3例,均與量表評估使用無關(guān)。以上結(jié)果均說明中文版S-PTD具有較好的可操作性和可行性,適用于外科病房護(hù)士對胃腸外科手術(shù)患者術(shù)后譫妄的篩查。
效度指測量工具對所需測量變量的準(zhǔn)確測量程度。內(nèi)容效度是指量表?xiàng)l目與測量內(nèi)容的符合程度,當(dāng)I-CVI值≥0.78,且S-CVI值≥0.90時,說明量表內(nèi)容效度良好[21]。中文版S-PTD的I-CVI值為0.78~1.00,S-CVI值為0.95,說明量表具有較好的內(nèi)容效度。結(jié)構(gòu)效度是評價(jià)量表結(jié)構(gòu)穩(wěn)定性的指標(biāo),因子分析是其最常用的檢驗(yàn)方法。本研究采用探索性因子分析檢驗(yàn)量表的結(jié)構(gòu)效度。探索性因子分析的結(jié)果顯示,共提取3個公因子,累計(jì)方差貢獻(xiàn)率為59.368%,表明量表的結(jié)構(gòu)效度理想??紤]原量表未對條目做詳細(xì)的維度區(qū)分,中文版S-PTD也未劃分維度。
信度代表測量結(jié)果的一致性和穩(wěn)定性,常用Cronbach’sα系數(shù)評價(jià)量表內(nèi)部一致性,運(yùn)用Guttman折半信度及Spearman重測信度表示量表的穩(wěn)定性[22]。當(dāng)量表總的Cronbach’sα系數(shù)>0.8,分量表Cronbach’sα系數(shù)>0.7,重測信度>0.7時,顯示量表信度良好[23]。本研究中根據(jù)專家內(nèi)容效度評價(jià)及量表可靠性統(tǒng)計(jì)結(jié)果刪除量表?xiàng)l目13后,中文版S-PTD總的Cronbach’sα系數(shù)為0.827,各因子的Cronbach’sα系數(shù)為0.726~0.741,說明量表12個條目之間的內(nèi)部一致性好。量表Guttman折半信度為0.738,說明中文版S-PTD各個條目間的內(nèi)在相關(guān)性和同質(zhì)性好。量表Spearman重測信度為0.783,表明量表具有較好的穩(wěn)定性。評估者間一致性常用Kappa值表示,Kappa值≥0.6時表明一致性好[24]。本研究中2名研究護(hù)士使用中文版S-PTD評估譫妄時,總體Kappa值為0.981,相較于原量表和其他譫妄評估量表有較好的評估者間一致性。因?yàn)镾-PTD的評估項(xiàng)目來源于患者住院期間的常見言行和病情觀察的內(nèi)容,是客觀觀察所得,只需要護(hù)士對值班期間患者是否出現(xiàn)類似狀況做記錄,因此量表Kappa值高,評估者間信度好。
量表的診斷價(jià)值常用靈敏度和特異度評價(jià),靈敏度越高,能夠正確識別譫妄患者的能力越強(qiáng),特異度越高排除非譫妄患者的正確率越高[25]。本研究中量表的靈敏度為0.678,特異度為0.935。相較于原量表的靈敏度(82.7%)稍低,特異度相當(dāng)[7]。一般當(dāng)靈敏度和特異度固定不變時,人群患病率越低,實(shí)驗(yàn)的陽性預(yù)告值愈低,陰性預(yù)告值愈高[25];本研究中靈敏度低可能與研究對象譫妄的發(fā)病率較低,研究場所為普通外科病房,護(hù)理人力資源不足導(dǎo)致對患者譫妄相關(guān)癥狀發(fā)現(xiàn)、觀察不足有關(guān)。截?cái)帱c(diǎn)界值是評價(jià)實(shí)驗(yàn)觀察值正常與異常的界定,將實(shí)驗(yàn)結(jié)果劃分為陽性與陰性兩部分[26]。研究結(jié)果顯示,中文版S-PTD診斷的閾值為2.5,但考慮此量表評分結(jié)果為整數(shù),故當(dāng)更注重靈敏度,避免漏診時可取最佳閾值為2;當(dāng)更注重特異度時可取最佳閾值為3,本研究取閾值為3。這一結(jié)果與原量表結(jié)果一致[7]。ROC曲線上每一點(diǎn)都代表著不同診斷閾值對應(yīng)的靈敏度與特異度,ROC曲線下的面積能客觀反映診斷系統(tǒng)的效能。一般認(rèn)為ROC曲線下面積>0.9表示診斷價(jià)值高,0.7~0.9表示診斷價(jià)值較好;0.5~0.7表示診斷價(jià)值低[25]。本研究中診斷閾值為3時,曲線下面積趨于最大,約為0.853,說明S-PTD的診斷價(jià)值較好。此外,該項(xiàng)研究具有最廣納入和最小排除標(biāo)準(zhǔn),比較接近“真實(shí)世界”的臨床實(shí)境。作為護(hù)士使用的篩查工具,它保持了與其他譫妄評估工具報(bào)告相當(dāng)?shù)母咛禺愋?,可快速、有效篩查出譫妄人群,及時預(yù)警、協(xié)助醫(yī)生盡早干預(yù)以改善患者的預(yù)后。
本研究結(jié)果表明,中文版S-PTD使用簡便且具有較好的信度、效度,可用于我國胃腸外科手術(shù)患者術(shù)后譫妄的評估,但是,本研究中在單中心開展、研究對象較為局限,今后可開展不同人群、多中心、大樣本量調(diào)查,進(jìn)一步驗(yàn)證該量表的臨床應(yīng)用價(jià)值。