陳祎婷 彭健,2 沈藍(lán)君,3 胡雁,2 余桂星 李錚
(1.復(fù)旦大學(xué)護(hù)理學(xué)院,上海 200032;2.復(fù)旦大學(xué)循證護(hù)理中心,上海 200032;3.復(fù)旦大學(xué)附屬華東醫(yī)院,上海 200040;4.廈門大學(xué)附屬翔安醫(yī)院,福建 廈門 361102)
隨著患者在醫(yī)療服務(wù)選擇中的自主權(quán)占比日益增加,患者可通過自己的認(rèn)知和判斷對(duì)自我結(jié)局進(jìn)行評(píng)估與審查[1],患者報(bào)告結(jié)局(Patient reported outcomes,PROs)即來自于患者對(duì)其自身健康狀況的直接測(cè)量[2],為適應(yīng)此現(xiàn)狀,醫(yī)學(xué)工作者們提出了患者報(bào)告結(jié)局測(cè)量工具(Patient reported mutcome measures,PROMs),但現(xiàn)有的PROMs質(zhì)量不一,研究者很難判斷應(yīng)用的PROMs是否為最佳選擇,因此,對(duì)PROMs展開高質(zhì)量的系統(tǒng)評(píng)價(jià)至關(guān)重要[3]。PROMs系統(tǒng)評(píng)價(jià)數(shù)量從20世紀(jì)90年代初的每年增加不到1篇,發(fā)展到目前每年增加超過100篇[3],但方法學(xué)質(zhì)量仍有很大改進(jìn)空間[4]。由荷蘭、美國和西班牙等研究機(jī)構(gòu)的心理測(cè)量學(xué)專家組成的COSMIN(Consensus-based standards for the selection of health measurement instruments,COSMIN)指導(dǎo)委員會(huì)提出了基于共識(shí)選擇健康測(cè)量工具的標(biāo)準(zhǔn)COSMIN[5],在現(xiàn)有PROMs系統(tǒng)評(píng)價(jià)的基礎(chǔ)上提出COSMIN方法,詳細(xì)闡述了如何制作規(guī)范的PROMs系統(tǒng)評(píng)價(jià)并形成最終推薦意見,以指導(dǎo)臨床實(shí)踐者與研究者選擇最佳PROMs[3]。本文旨在介紹COSMIN方法,以期為國內(nèi)研究者制作PROMs系統(tǒng)評(píng)價(jià)提供參考。
1.1相關(guān)術(shù)語與定義 2006-2007年,COSMIN進(jìn)行了第1次德爾菲研究,明確了PROMs測(cè)量屬性的類型和定義[3]。COSMIN將PROMs測(cè)量屬性分為3個(gè)維度,即信度、效度和反應(yīng)度,其中信度維度包括穩(wěn)定性、內(nèi)部一致性與測(cè)量誤差;效度維度包括內(nèi)容效度、構(gòu)念效度與效標(biāo)效度。COSMIN對(duì)于PROMs測(cè)量屬性的分類,見圖1;各維度具體定義,見表1。
1.2相關(guān)概念辨析
1.2.1構(gòu)念效度的翻譯 本文將Construct譯作構(gòu)念?!癈onstruct”譯法繁多[6],其中“構(gòu)念”強(qiáng)調(diào)建造、創(chuàng)造、人為,且包含了結(jié)構(gòu)(Structure)這層意思,又與“結(jié)構(gòu)效度(Structure validity)”相區(qū)分,故本文將“construct validity”譯作“構(gòu)念效度”。
表1 PROMs測(cè)量屬性的定義
圖1 PROMs測(cè)量屬性的分類
1.2.2構(gòu)念效度與結(jié)構(gòu)效度的區(qū)分及假設(shè)檢驗(yàn)含義 構(gòu)念效度指研究者在PROMs真實(shí)反映所測(cè)構(gòu)念的前提下可制定假設(shè),此時(shí)PROMs得分與所制定假設(shè)的吻合程度,包含結(jié)構(gòu)效度、假設(shè)檢驗(yàn)與跨文化效度/測(cè)量不變性3種測(cè)量屬性,假設(shè)分3種,(1)結(jié)構(gòu)效度:PROMs結(jié)構(gòu)(維度)的假設(shè)。(2)聚合/區(qū)分效度:與其他測(cè)量工具關(guān)系的假設(shè)。(3)已知組別效度:不同亞組間差異的假設(shè)。構(gòu)念效度包含結(jié)構(gòu)效度,范圍更廣。而結(jié)構(gòu)效度僅指PROMs維度與所測(cè)構(gòu)念維度的吻合程度,僅反應(yīng)PROMs總體結(jié)構(gòu)是否適合所測(cè)構(gòu)念。 假設(shè)檢驗(yàn)是驗(yàn)證構(gòu)念效度的一種方法。假設(shè)越具體,被檢驗(yàn)的假設(shè)越多,就有越多證據(jù)證明測(cè)量工具的構(gòu)念效度。評(píng)估構(gòu)念效度的假設(shè)包括兩類:與其他測(cè)量工具的關(guān)系假設(shè)即聚合/區(qū)分效度[7],與對(duì)不同亞組間差異的假設(shè)即已知組別效度。
1.2.3信度與穩(wěn)定性 信度與穩(wěn)定性的原文均為Reliability,但信度較廣泛,指PROMs不受測(cè)量誤差影響的程度,包含穩(wěn)定性、內(nèi)部一致性與測(cè)量誤差。穩(wěn)定性是信度的下屬測(cè)量屬性,指對(duì)同一受試者采用同樣方法重復(fù)測(cè)量時(shí)所得結(jié)果的一致性程度,包含重測(cè)信度、評(píng)定者間信度與評(píng)定者(或受試者)內(nèi)信度。
COSMIN將PROMs系統(tǒng)評(píng)價(jià)的制作分為3個(gè)階段,10項(xiàng)步驟,見圖2。階段一為進(jìn)行文獻(xiàn)檢索,含步驟1~4,內(nèi)容是明確系統(tǒng)評(píng)價(jià)目的、制定納入和排除標(biāo)準(zhǔn)、實(shí)施文獻(xiàn)檢索和獲取與篩選文獻(xiàn)。階段二為評(píng)價(jià)PROMs測(cè)量屬性,含步驟5~7,每個(gè)步驟均可分3部分:(1)應(yīng)用COSMIN偏倚風(fēng)險(xiǎn)清單評(píng)價(jià)每項(xiàng)研究的偏倚風(fēng)險(xiǎn)。(2)應(yīng)用COSMIN質(zhì)量準(zhǔn)則評(píng)價(jià)PROMs測(cè)量屬性質(zhì)量。(3)匯總PROMs測(cè)量屬性的評(píng)價(jià)結(jié)果,運(yùn)用GRADE系統(tǒng)形成推薦等級(jí)。階段三為選擇PROMs,含步驟8~10,內(nèi)容是描述可解釋性和適用性、形成PROMs推薦意見及報(bào)告系統(tǒng)評(píng)價(jià)。
圖2 COSMIN系統(tǒng)評(píng)價(jià)流程
2.1階段一 進(jìn)行文獻(xiàn)檢索。
2.1.1步驟1:明確系統(tǒng)評(píng)價(jià)目的 制作PROMs系統(tǒng)評(píng)價(jià)時(shí)需明確4個(gè)關(guān)鍵要素:(1)PROMs所測(cè)構(gòu)念。(2)目標(biāo)人群。(3)PROMs類型(如他評(píng)或自評(píng)PROMs)。(4)感興趣的測(cè)量屬性。如某系統(tǒng)評(píng)價(jià)是為了評(píng)價(jià)成人腦卒中患者疲勞程度自評(píng)PROMs所有測(cè)量屬性的質(zhì)量,那么其感興趣的構(gòu)念是“疲勞”,目標(biāo)人群是“成人腦卒中患者”,PROMs類型是“自評(píng)量表”,感興趣的是 “所有”測(cè)量屬性。
2.1.2步驟2:制定納入和排除標(biāo)準(zhǔn) 納入標(biāo)準(zhǔn):(1)PROMs須符合研究者關(guān)注的構(gòu)念。(2)研究樣本能代表目標(biāo)人群。(3)研究與PROMs有關(guān)。(4)研究目的是PROMs測(cè)量屬性評(píng)價(jià)或PROMs研發(fā)與可解釋性說明等。排除將PROMs作為結(jié)果測(cè)量工具(如干預(yù)性研究)或作為另一種PROMs效度檢驗(yàn)標(biāo)準(zhǔn)的研究。
2.1.3步驟3:實(shí)施文獻(xiàn)檢索 建議至少檢索Medline與Embase,自行選擇其他數(shù)據(jù)庫。檢索詞應(yīng)包括相關(guān)主題詞與自由詞,并含4個(gè)關(guān)鍵要素(所測(cè)構(gòu)念、目標(biāo)人群、類型與測(cè)量屬性)。不建議對(duì)語種設(shè)限。檢索時(shí)可用Terwee等人開發(fā)的用于檢索PROMs的PubMed過濾器[8]。
2.1.4步驟4:獲取與篩選文獻(xiàn) 檢索完成后,需雙人獨(dú)立篩選文獻(xiàn),若2名研究者無法達(dá)成共識(shí),則咨詢第三方。為確保納入盡可能全的文獻(xiàn),可采用追溯參考文獻(xiàn)及咨詢專家的方式。此外,應(yīng)呈現(xiàn)篩選流程圖(同PRISMA)。
2.2階段二 評(píng)價(jià)PROMs測(cè)量屬性。由于某些測(cè)量屬性的重要性(如內(nèi)容效度可能最重要)及各測(cè)量屬性間可能存在相關(guān)性(如結(jié)構(gòu)效度有助于解釋內(nèi)部一致性系數(shù)),COSMIN推薦先評(píng)內(nèi)容效度,再評(píng)內(nèi)部結(jié)構(gòu),最后評(píng)其他測(cè)量屬性。每種測(cè)量屬性評(píng)價(jià)包括3部分:(1)應(yīng)用COSMIN偏倚風(fēng)險(xiǎn)清單評(píng)價(jià)每項(xiàng)研究的偏倚風(fēng)險(xiǎn)。(2)應(yīng)用COSMIN質(zhì)量準(zhǔn)則評(píng)價(jià)PROMs每種測(cè)量屬性的證據(jù)質(zhì)量。(3)匯總PROMs測(cè)量屬性評(píng)價(jià)結(jié)果,用GRADE系統(tǒng)形成推薦等級(jí)。首先,應(yīng)用COSMIN偏倚風(fēng)險(xiǎn)清單評(píng)價(jià)每項(xiàng)研究的偏倚風(fēng)險(xiǎn)。PROMs測(cè)量屬性研究在研究設(shè)計(jì)和統(tǒng)計(jì)分析中出現(xiàn)缺陷,會(huì)導(dǎo)致研究結(jié)果嚴(yán)重受影響而產(chǎn)生偏倚。據(jù)測(cè)量屬性分類及評(píng)價(jià)順序,COSMIN偏倚風(fēng)險(xiǎn)清單分為3部分,共10個(gè)框目,見表2。
表2 COSMIN偏倚風(fēng)險(xiǎn)清單的結(jié)構(gòu)
其次,應(yīng)用COSMIN質(zhì)量準(zhǔn)則評(píng)價(jià)PROMs每種測(cè)量屬性的證據(jù)質(zhì)量。測(cè)量屬性質(zhì)量指測(cè)量屬性是否“好”,需與 “質(zhì)量準(zhǔn)則”比較。如在重測(cè)信度研究中,若加權(quán)Kappa系數(shù)≥0.70,則表明重測(cè)信度良好[4]。完成納入研究的偏倚風(fēng)險(xiǎn)評(píng)價(jià)后,由兩位研究者獨(dú)立提取研究中涉及的PROMs數(shù)據(jù)信息,包括樣本特征、測(cè)量屬性結(jié)果、可解釋性與適用性等。PROMs某一測(cè)量屬性的所有數(shù)據(jù)信息匯總稱為該測(cè)量屬性的證據(jù),應(yīng)用COSMIN質(zhì)量準(zhǔn)則(Quality criteria)評(píng)價(jià)該證據(jù)質(zhì)量,獲得各測(cè)量屬性的證據(jù)質(zhì)量。
最后,用改良的GRADE方法對(duì)上述證據(jù)質(zhì)量評(píng)級(jí),反映證據(jù)質(zhì)量的確信程度。COSMIN改良了傳統(tǒng)GRADE系統(tǒng)[9],以偏倚風(fēng)險(xiǎn)、不一致性、不精確性(不適用于內(nèi)容效度評(píng)級(jí))和間接性四個(gè)因素對(duì)每種測(cè)量屬性的證據(jù)質(zhì)量進(jìn)行評(píng)級(jí)(具體參見本系列其他文章)。改良的GRADE系統(tǒng)假設(shè)初始證據(jù)質(zhì)量均為高等級(jí),當(dāng)存在偏倚風(fēng)險(xiǎn)、不一致、不精確或間接性時(shí),降低證據(jù)推薦等級(jí)。等級(jí)評(píng)價(jià)由兩位研究員獨(dú)立完成,必要時(shí)詢問第3方意見。證據(jù)結(jié)果需進(jìn)行定量合成與定性總結(jié),制成結(jié)果總結(jié)表,以便在特定人群與情境下選擇最佳PROMs。
2.2.1步驟5:評(píng)價(jià)內(nèi)容效度 內(nèi)容效度是指PROMs的內(nèi)容與所測(cè)構(gòu)念的吻合程度[10]。內(nèi)容效度是最重要的測(cè)量屬性,因須先弄清PROMs條目內(nèi)容在所測(cè)構(gòu)念與目標(biāo)人群條件下是否相關(guān)、全面且可理解。內(nèi)容效度評(píng)價(jià)依靠研究者主觀判斷,評(píng)估方法可參考Terwee等[11]的研究。若有高質(zhì)量證據(jù)證明某PROMs內(nèi)容效度不良,則跳過步驟6~8,直接在步驟9中提出推薦建議。
2.2.2步驟6:評(píng)價(jià)內(nèi)部結(jié)構(gòu) COSMIN將結(jié)構(gòu)效度、內(nèi)部一致性、跨文化效度/測(cè)量不變性歸為內(nèi)部結(jié)構(gòu),這些測(cè)量屬性關(guān)注PROMs各條目質(zhì)量及條目間的相互關(guān)系,對(duì)于解釋條目如何構(gòu)成PROMs非常重要。COSMIN建議在評(píng)估內(nèi)容效度后直接評(píng)價(jià)內(nèi)部結(jié)構(gòu)。此外,步驟6僅適用基于“反應(yīng)模型”的PROMs,“反應(yīng)模型”(Reflective model)指PROMs所有條目都是某一潛在構(gòu)念的表現(xiàn)形式,條目間高度相關(guān)且可互換。另一種量表構(gòu)建方式是“形成模型”(Formative model),在該模型中,條目共同形成構(gòu)念,條目間無需相互關(guān)聯(lián)。若某PROMs不基于“反應(yīng)模型”,則跳過步驟6。
2.2.3步驟7:評(píng)價(jià)其他測(cè)量屬性 其他測(cè)量屬性包括穩(wěn)定性、測(cè)量誤差、效標(biāo)效度、假設(shè)檢驗(yàn)和反應(yīng)度。與內(nèi)部結(jié)構(gòu)不同,這些測(cè)量屬性反映PROMs整體質(zhì)量,而非條目質(zhì)量。
評(píng)價(jià)測(cè)量誤差時(shí),評(píng)價(jià)者需獲得SDC、LoA及MIC信息。MIC應(yīng)由基于錨定法的縱向研究確定,若無足夠信息判斷SDC或LoA是否小于MIC,應(yīng)僅報(bào)告SDC或LoA,不對(duì)證據(jù)質(zhì)量評(píng)級(jí)。關(guān)于假設(shè)檢驗(yàn)和反應(yīng)度,建議研究者自己制定假設(shè)并對(duì)結(jié)果進(jìn)行評(píng)估。假設(shè)根據(jù)研究目的制定,包括預(yù)期關(guān)系,如審查的PROMs與用于比較的PROMs間的關(guān)系,及相關(guān)關(guān)系的預(yù)期方向和大小。同組假設(shè)下納入研究的結(jié)果均可進(jìn)行比較,若超過75%的研究結(jié)果符合假設(shè),可認(rèn)為結(jié)果與假設(shè)一致,評(píng)為“充分”。
2.3階段三 選擇PROMs。
2.3.1步驟8:描述可解釋性和適用性 可解釋性指PROMs的定量分?jǐn)?shù)(或分?jǐn)?shù)變化)被賦予定性意義(如臨床意義)的能力。適用性指PROMs在限制時(shí)間或資金條件下是否易于使用,如完成時(shí)間、資金花費(fèi)、內(nèi)容長度、回答形式與難易度等。其非測(cè)量屬性,但是選擇最佳PROMs的重要考慮因素之一。
2.3.2步驟9:形成PROMs推薦建議 針對(duì)研究人群與目的,研究者需提出在該領(lǐng)域選擇最佳PROMs的建議,COSMIN將PROMs分為3類:A類PROMs內(nèi)容效度“充分”(任何等級(jí)證據(jù)),且內(nèi)部一致性充分(至少為低質(zhì)量證據(jù));B類PROMs不屬于A類或C類;C類PROMs有高質(zhì)量證據(jù)證明其測(cè)量屬性“不充分”。A類被推薦使用,用此類PROMs的研究結(jié)果是可信的;B類被認(rèn)為有可應(yīng)用的潛力,但需進(jìn)一步的研究評(píng)價(jià);C類不建議使用。若目前只有B類PROMs,在更佳證據(jù)出現(xiàn)前,內(nèi)容效度最好的B類PROMs被推薦使用。最終推薦意見應(yīng)說明將PROMs歸于某類的原因,并提出未來研究建議。
2.3.3步驟10:報(bào)告系統(tǒng)評(píng)價(jià) COSMIN建議報(bào)告應(yīng)含有:(1)檢索策略與結(jié)果、篩選過程與流程圖。(2)納入PROMs的信息,如PROMs名稱、所測(cè)構(gòu)念、測(cè)量屬性、語言版本、研究對(duì)象、使用情境、(子)量表數(shù)、條目數(shù)、回答選項(xiàng)、回憶期、可解釋性與適用性。(3)納入研究的人群信息,如地域、語言、疾病特征、目標(biāo)人群及樣本量等。(4)每項(xiàng)PROMs測(cè)量屬性研究的偏倚風(fēng)險(xiǎn)。(5)最終推薦意見以結(jié)果總結(jié)表形式呈現(xiàn),內(nèi)容包含測(cè)量屬性的質(zhì)量評(píng)價(jià)(充分、不足或不確定)與證據(jù)質(zhì)量等級(jí)(高、中、低或極低)。研究討論部分應(yīng)提出最佳PROMs并給予意見,此外還建議公開檢索策略。
COSMIN旨在制定規(guī)范的PROMs系統(tǒng)評(píng)價(jià)制作標(biāo)準(zhǔn),以幫助臨床實(shí)踐和研究選擇PROMs。除COSMIN方法外,美國心理學(xué)協(xié)標(biāo)準(zhǔn)、美國醫(yī)學(xué)結(jié)局研究組科學(xué)咨詢委員會(huì)標(biāo)準(zhǔn)、患者報(bào)告結(jié)局測(cè)量評(píng)估工具、Terwee標(biāo)準(zhǔn)及Francis等人的清單也為PROMs系統(tǒng)評(píng)價(jià)制定了質(zhì)量評(píng)價(jià)標(biāo)準(zhǔn)。但較COSMIN而言,這些標(biāo)準(zhǔn)簡短,未系統(tǒng)解釋評(píng)價(jià)步驟,且混淆研究的方法學(xué)質(zhì)量標(biāo)準(zhǔn)與PROMs測(cè)量屬性的質(zhì)量準(zhǔn)則;未描述如何將多項(xiàng)不同質(zhì)量的研究結(jié)果合并,故無法得出1個(gè)關(guān)于PROMs的總體結(jié)論;不夠詳細(xì),無法對(duì)PROMs測(cè)量屬性研究的偏倚風(fēng)險(xiǎn)提供透明且系統(tǒng)的評(píng)價(jià)[12]。
COSMIN也存在一定局限性[3]。首先,其研發(fā)并非全部基于德爾菲法或名義群體法;其次,其尚未完備,仍需改進(jìn):(1)COSMIN建議在制作PROMs系統(tǒng)評(píng)價(jià)時(shí)搜索多個(gè)數(shù)據(jù)庫,但目前國外研究者發(fā)現(xiàn)檢索Medline與Embase外的其他英文數(shù)據(jù)庫的價(jià)值尚不明確,需進(jìn)一步研究。(2)除Medline與Embase外,應(yīng)盡快為其他數(shù)據(jù)庫開發(fā)適用于查找PROMs測(cè)量屬性研究的檢索過濾器。(3)關(guān)于測(cè)量屬性的統(tǒng)計(jì)合并方法很少。(4)證據(jù)質(zhì)量表中樣本量的要求只基于經(jīng)驗(yàn),未得研究證實(shí)。(5)證據(jù)質(zhì)量等級(jí)評(píng)定方法仍待完善,PROMs測(cè)量屬性研究很少登記注冊(cè),因此很難在PROMs的系統(tǒng)評(píng)價(jià)中評(píng)估存在的發(fā)表偏倚。目前雖有降低證據(jù)質(zhì)量的標(biāo)準(zhǔn),但無定義升高證據(jù)質(zhì)量的標(biāo)準(zhǔn)。
目前,國內(nèi)學(xué)者對(duì)COSMIN方法的認(rèn)識(shí)與應(yīng)用較少,本文希望通過解讀將COSMIN方法引入國內(nèi),規(guī)范國內(nèi)PROMs系統(tǒng)評(píng)價(jià)的制作過程,提高系統(tǒng)評(píng)價(jià)研究的質(zhì)量;幫助臨床工作者或研究員在特定人群與情境下選擇最佳PROMs,節(jié)約研究成本與時(shí)間;此外,對(duì)于PROMs的研發(fā)人員而言,在制作量表的過程中,可參照COSMIN要求,規(guī)范流程,制作出高質(zhì)量、適用性強(qiáng)的PROMs。