陳祎婷,彭 健,2,沈藍君,3,胡 雁,2,余桂星,李 錚,2*
1.復(fù)旦大學(xué)護理學(xué)院,上海200032;2.復(fù)旦大學(xué)循證護理中心;3.復(fù)旦大學(xué)附屬華東醫(yī)院;4.廈門大學(xué)附屬翔安醫(yī)院
由荷蘭、美國、西班牙等研究機構(gòu)的心理測量學(xué)專家組成的指導(dǎo)委員會提出了基于共識選擇健康測量工具的標(biāo)準(zhǔn)(Consensus-Based Standards for the Selection of Health Measurement Instruments,COSMIN)[1],闡述了如何制作規(guī)范的患者報告結(jié)局測量工具(Patient Reported Outcome Measures,PROMs)系統(tǒng)評價并形成最終推薦意見,以指導(dǎo)研究者與臨床實踐者選擇最合適的PROMs[2]。本研究以Lee 等[3]于2019 年發(fā)表的一篇關(guān)于情緒自評量表(Depression Anxiety Stress Scale-21,DASS-21)的系統(tǒng)評價為例,對COSMIN 系統(tǒng)評價制作方法的流程進行解讀,旨在促進國內(nèi)研究者與臨床實踐者的深入理解和正確使用、規(guī)范系統(tǒng)評價的制作,為最佳PROMs 的選擇提供科學(xué)參考依據(jù)。
階段一包括步驟1~步驟4,該階段與常規(guī)系統(tǒng)評價基本一致,主要內(nèi)容為明確系統(tǒng)評價目的、制定納入和排除標(biāo)準(zhǔn)、實施文獻檢索、獲取與篩選文獻。
1.1 步驟1:明確系統(tǒng)評價目的 在制作PROMs 系統(tǒng)評價時,首先需要明確PROMs 的4 個關(guān)鍵要素,即PROMs 所測構(gòu)念、目標(biāo)人群、PROMs 類型及感興趣的測量屬性。Lee 等[3]在文章的方法部分,明確提出該系統(tǒng)評價關(guān)注的PROMs 是情緒自評量表(DASS-21),所測的構(gòu)念為抑郁、焦慮與壓力,目標(biāo)人群為健康人、慢性病病人與精神病病人,評價所有測量屬性。其實,PROMs 系統(tǒng)評價中并不一定要包括所有種類的測量屬性(理論上每種測量屬性都可以單獨制作系統(tǒng)評價),根據(jù)研究興趣和文章篇幅,研究者可以決定一篇PROMs 系統(tǒng)評價中應(yīng)該包含幾種測量屬性。比如PROMs 內(nèi)容效度的評價過程較為復(fù)雜,可以獨立于其他測量屬性單獨制作系統(tǒng)評價。例如Chiarotto 等[4]僅對17 個可測量腰背痛的PROMs 進行內(nèi)容效度的系統(tǒng)評價。
1.2 步驟2:制定納入和排除標(biāo)準(zhǔn) 根據(jù)系統(tǒng)評價的目的制定了4 個納入標(biāo)準(zhǔn)。第一,納入研究所含的PROMs 必須符合研究者關(guān)注的構(gòu)念;第二,研究樣本能夠代表目標(biāo)人群(如超過50%的樣本為目標(biāo)人群);第三,納入的研究應(yīng)為患者報告結(jié)局測量工具;第四,納入研究的目的應(yīng)是評價PROMs 的測量屬性或是對PROMs 的研發(fā)與可解釋性的說明等。由于Lee 等[3]的目標(biāo)是評價DASS-21 所有測量屬性在健康人、慢性病病人與精神病病人人群中的應(yīng)用情況,故其制定的納入與排除標(biāo)準(zhǔn)比較有針對性,納入標(biāo)準(zhǔn)包括研究關(guān)注DASS-21 測量屬性,關(guān)注的目標(biāo)人群是健康人、慢性病病人與精神病病人,且是已發(fā)表并可獲得全文的英文文獻;排除標(biāo)準(zhǔn)也遵循COSMIN 原則,包括排除將DASS-21 作為結(jié)果測量工具的研究(如干預(yù)性研究)或作為另一種PROMs 效度檢驗標(biāo)準(zhǔn)的研究,且考慮到在14 歲以下人群中DASS-21 的效度無法驗證,故排除14 歲以下這一年齡段人群。
1.3 步驟3:實施文獻檢索 COSMIN 建議至少檢索MedLine 與EMbase 數(shù)據(jù)庫,是否檢索其他數(shù)據(jù)庫可由研究者自行選擇。除MedLine 與EMbase 數(shù)據(jù)庫外,Lee 等[3]還檢索了CINAHL 數(shù)據(jù)庫。國內(nèi)研究者與臨床工作者在制作系統(tǒng)評價時,可根據(jù)具體情況檢索中英文數(shù)據(jù)庫,以盡可能全面地檢索到相關(guān)文獻。檢索詞應(yīng)該包括相關(guān)的主題詞與自由詞,并需包含前文提及的4 個關(guān)鍵要素(所測構(gòu)念、目標(biāo)人群、PROMs 類型與測量屬性)。Lee 等[3]根據(jù)關(guān)鍵要素擬定了檢索詞“depression AND anxiety AND stress”“Depression Anxiety Stress Scale”“DASS”,但其缺少了目標(biāo)人群的檢索詞,應(yīng)補充完整,且該文章檢索的數(shù)據(jù)庫與檢索式過于簡單,在制作系統(tǒng)評價時應(yīng)將檢索過程更完整地呈現(xiàn)給讀者。
此外,Lee 等[3]參考COSMIN 建議,應(yīng)用了牛津大學(xué)PROM 小組開發(fā)的檢索過濾器(http://phi.uhce.ox.ac.uk)與Terwee 等[5]開發(fā)的檢索過濾器進行檢索,以盡可能檢索全面。
1.4 步驟4:獲取與篩選文獻 檢索完成后,Lee 等[3]遵循COSMIN 方法,雙人獨立使用EndNote 文獻管理工具對文獻進行查重與篩選,針對存在的疑問與不一致的意見,采取咨詢第三方專家的方法,并追溯參考文獻進行人工檢索與納入。提取每篇研究的數(shù)據(jù)信息,如樣本含量、人群類別、國家/地區(qū)、使用場所等。文獻的篩選流程圖與數(shù)據(jù)提取表在最終完成的系統(tǒng)評價中有清晰的呈現(xiàn)。
COSMIN 推薦先評價PROMs 內(nèi)容效度,再評價PROMs 內(nèi)部結(jié)構(gòu),最后評價其他測量屬性,分別對應(yīng)步驟5~步驟7。PROMs 的測量屬性評價一般分為3 個部分(除內(nèi)容效度外):①應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項研究的偏倚風(fēng)險;②應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 每種測量屬性的證據(jù)質(zhì)量;③匯總PROMs 測量屬性的評價結(jié)果,運用GRADE 系統(tǒng)形成證據(jù)等級。Lee 等[3]應(yīng)用COSMIN 偏倚風(fēng)險清單對每項研究的偏倚風(fēng)險進行評價,采用“很好(very good)”“良 好(adequate)”“模 糊(doubtful)”“不 良(inadequate)”4 級評分,并以最低計分原則來確定。并應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 每種測量屬性的證據(jù)質(zhì)量,匯總后運用改良版GRADE 系統(tǒng)形成證據(jù)等級。
Lee 等[3]在應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項研究的偏倚風(fēng)險這部分的內(nèi)容未呈現(xiàn),且目前已發(fā)表文章中尚未檢索到應(yīng)用更新后的COSMIN 偏倚風(fēng)險清單評價納入文獻方法學(xué)質(zhì)量的,為幫助未來的研究者更好地應(yīng)用COSMIN 工具,本研究對此部分做簡要介紹。PROMs 測量屬性研究的偏倚風(fēng)險與PROMs 的質(zhì)量不能相混淆,偏倚風(fēng)險是指單個研究在設(shè)計、實施和分析過程中產(chǎn)生的偏倚,若測量屬性研究的偏倚風(fēng)險很高,那么其研究結(jié)果可能就不可信[6]。COSMIN 設(shè)計了偏倚風(fēng)險清單,并有一套使用順序:評估相關(guān)性(根據(jù)研究關(guān)注的測量屬性選擇不同的框目)、評價PROMs 內(nèi)容效度、評價PROMs 內(nèi)部結(jié)構(gòu)與評價PROMs 其他測量屬性,具體評價方式可見本系列其他文章。
2.1 步驟5:評價內(nèi)容效度 內(nèi)容效度是最重要的測量屬性,因此,必須先弄清PROMs 條目內(nèi)容在所測構(gòu)念與目標(biāo)人群條件下是相關(guān)的、全面的且可理解的。內(nèi)容效度的評價分為3 步:第1 步是評價PROMs 開發(fā)過程的偏倚風(fēng)險,第2 步是評價PROMs 內(nèi)容效度研究的偏倚風(fēng)險,第3 步是綜合所有證據(jù),并考慮評價者對PROMs 本身的判斷,使用COSMIN 提出的評分系統(tǒng)來評價PROMs 的內(nèi)容效度。但Lee 等[3]未呈現(xiàn)偏倚風(fēng)險評價部分,只匯報了第3 步。其首先根據(jù)COSMIN開發(fā)的PROMs 內(nèi)容效度的10 項質(zhì)量準(zhǔn)則(相關(guān)性、全面性、可理解性)對每項研究中的PROMs 內(nèi)容效度進行評價。每項準(zhǔn)則均可以被評為“充分(+)”、“不足(-)”或“不確定(?)”。“充分(+)”是指≥85%PROMs(或子量表)的條目符合準(zhǔn)則;“不足(-)”是指<85%PROMs(或子量表)的條目符合準(zhǔn)則;“不確定(?)”是指沒有足夠的信息或者研究的偏倚風(fēng)險被評為“不良”(質(zhì)量準(zhǔn)則具體可見本系列其他文章)。然后,以GRADE 方法進行證據(jù)評級,發(fā)現(xiàn)DASS-21 內(nèi)容效度的全面性為“充分(+)”,高質(zhì)量證據(jù);可理解性為“充分(+)”,中質(zhì)量證據(jù);相關(guān)性為“充分(+)”,極低質(zhì)量證據(jù)。故最終對內(nèi)容效度屬性評價為“充分(+)”,GRADE 證據(jù)等級評價為“中等”。內(nèi)容效度的評估需研究者的主觀判斷,具體評估方法可參考Terwee 等[7]的研究。若有高質(zhì)量證據(jù)證明某PROMs 的內(nèi)容效度不良,則可跳過步驟6~步驟8,直接在步驟9 中對該PROMs 提出推薦建議。
2.2 步驟6:評價內(nèi)部結(jié)構(gòu) 內(nèi)部結(jié)構(gòu)的評價分為3 步:第1 步是應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項關(guān)于PROMs 內(nèi)部結(jié)構(gòu)研究的偏倚風(fēng)險,第2 步是應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 內(nèi)部結(jié)構(gòu)測量屬性的證據(jù)質(zhì)量,第3 步是匯總PROMs 內(nèi)部結(jié)構(gòu)測量屬性的評價結(jié)果,運用GRADE 系統(tǒng)形成證據(jù)等級。Lee 等[3]未呈現(xiàn)內(nèi)部結(jié)構(gòu)研究的偏倚風(fēng)險評價部分,只匯報了證據(jù)質(zhì)量和GRADE 分級。
2.2.1 結(jié)構(gòu)效度 COSMIN 對結(jié)構(gòu)效度評價的質(zhì)量準(zhǔn)則見表1。Lee 等[3]在這部分使用了其他標(biāo)準(zhǔn),因為COSMIN 質(zhì)量準(zhǔn)則中不包括結(jié)構(gòu)效度的探索性因素分析(EFA)(“+”,至少50% 的方差可被解釋)或Pearson 相關(guān)系數(shù)(“+”,r≥0.80)的可靠性。這提示COSMIN 質(zhì)量準(zhǔn)則仍有待補充與完善,但Lee 等[3]并未說明該標(biāo)準(zhǔn)的來源。Lee 等[3]結(jié)合定性總結(jié)最終評價得出DASS-21 的三因子模型結(jié)構(gòu)效度為“充分(+)”,中質(zhì)量證據(jù);雙因子模型結(jié)構(gòu)效度為“充分(+)”,高質(zhì)量證據(jù)。
表1 COSMIN 對結(jié)構(gòu)效度評價的質(zhì)量準(zhǔn)則
2.2.2 內(nèi)部一致性 COSMIN 對內(nèi)部一致性評價的質(zhì)量準(zhǔn)則見表2。Lee 等[3]評價發(fā)現(xiàn),DASS-21 的抑郁、焦慮、壓力三因子模型的Cronbach's α 值分別為0.83~0.94,0.66~0.87 和0.79~0.91,最終評價為“充分(+)”,中質(zhì)量證據(jù);雙因子模型Omega 系數(shù)分別為0.89~0.97(總分)、0.86~0.99(抑郁)、0.82~0.99(焦慮)和0.85~0.99(壓力),Cronbach's α 值分別0.90~0.95(總分),0.82~0.92(抑郁),0.74~0.88(焦慮)和0.76~0.90(壓力),且有證據(jù)對DASS-21 的結(jié)構(gòu)效度進行說明,最終評價為“充分(+)”,高質(zhì)量證據(jù)。
表2 COSMIN 對內(nèi)部一致性評價的質(zhì)量準(zhǔn)則
2.2.3 跨文化效度/測量不變性 COSMIN 對跨文化效度/測量不變性評價的質(zhì)量準(zhǔn)則見表3。Lee 等[3]發(fā)現(xiàn)共有6 項研究報告了DASS-21 的跨文化效度/測量不變性,其中5 項基于三因子模型,其余1 項基于雙因子模型。5 項研究的質(zhì)量評級不一致,且無法尋求合適的理由給予解釋,故按性別、種族、國家和疾病狀況劃分亞組。按性別劃分的亞組分析發(fā)現(xiàn),DASS-21 跨文化效度/測量不變性的相關(guān)研究結(jié)果不一致。其他3 個亞組僅包括1 項研究,故無法匯總分析,不給予等級評價。提示在無法為不一致性尋求合適解釋時,可以進行分組討論來分析結(jié)果。
表3 COSMIN 對跨文化效度/測量不變性評價的質(zhì)量準(zhǔn)則
2.3 步驟7:評價其他測量屬性 步驟7 需要評價其他測量屬性,包括穩(wěn)定性、測量誤差、效標(biāo)效度、假設(shè)檢驗效度和反應(yīng)度。與步驟6 中的內(nèi)部結(jié)構(gòu)不同,這些測量屬性反映的是PROMs 整體質(zhì)量,而非條目的質(zhì)量。其他測量屬性的評價分為3 步:第1 步是應(yīng)用COSMIN 偏倚風(fēng)險清單評價每項關(guān)于PROMs 其他測量屬性研究的偏倚風(fēng)險,第2 步是應(yīng)用COSMIN 質(zhì)量準(zhǔn)則評價PROMs 其他測量屬性的證據(jù)質(zhì)量,第3 步是匯總PROMs 其他測量屬性的評價結(jié)果,運用GRADE系統(tǒng)形成證據(jù)等級。Lee 等[3]未呈現(xiàn)內(nèi)部結(jié)構(gòu)研究的偏倚風(fēng)險評價部分,只匯報了證據(jù)質(zhì)量和GRADE 分級。Lee 等[3]基于COSMIN 方法采用質(zhì)量準(zhǔn)則對DASS-21 的穩(wěn)定性、測量誤差、效標(biāo)效度、假設(shè)檢驗效度和反應(yīng)度進行逐一評價,并對匯總的證據(jù)使用改良版GRADE 方法進行等級評級。
2.3.1 穩(wěn)定性 COSMIN 對穩(wěn)定性評價的質(zhì)量準(zhǔn)則見表4。Lee 等[3]發(fā)現(xiàn),有5 項研究報告了DASS-21 的穩(wěn)定性,但僅有1 項研究評估了組內(nèi)相關(guān)系數(shù)(intraclass correlation coefficient,ICC),其余研究結(jié)果并不充分,結(jié)果不足的原因可能是間隔期管理存在問題。在剔除兩項間隔3~6 個月的研究后,Lee 等[3]定性總結(jié)了3 項研究,其中2 項研究的Pearson 相關(guān)系數(shù)分別為0.75~0.78(抑 郁)、0.64~0.73(焦 慮)與0.64~0.65(壓 力)。由于存在嚴重的偏倚風(fēng)險和嚴重的不一致性,故總體評價為“不充分(-),”為低質(zhì)量證據(jù)。
表4 COSMIN 對穩(wěn)定性評價的質(zhì)量準(zhǔn)則
2.3.2 測量誤差 COSMIN 對測量誤差評價的質(zhì)量準(zhǔn)則見表5。Lee 等[3]檢索發(fā)現(xiàn),沒有對DASS-21 測量誤差進行評價的研究,故標(biāo)明“無可用信息”。為每項研究計算最小可測變化(smallest detectable change,SDC)或一致性限度(limits of agreement,LoA),如果SDC 或LoA 小于最小有意義變化(minimal important change,MIC),則認為研究對測量誤差這一測量屬性評價是充足的。
表5 COSMIN 對測量誤差評價的質(zhì)量準(zhǔn)則
2.3.3 效標(biāo)效度 COSMIN 對效標(biāo)效度評價的質(zhì)量準(zhǔn)則見表6。Lee等[3]發(fā)現(xiàn),有3項研究報告了DASS-21的效標(biāo)效度。將美國精神障礙診斷與統(tǒng)計手冊(DSM-Ⅳ)軸Ⅰ診斷用定式臨床檢查手冊(Structured Clinical Interview for DSM-ⅣAxis 1 Diagnoses,SCID)中的抑郁和焦慮部分作為DASS-21 的金標(biāo)準(zhǔn),結(jié)果顯示,DASS-21 抑 郁、焦 慮 分 量 表 與SCID 抑郁、SCID 焦慮的受試者工作特征曲線(ROC)下與坐標(biāo)軸圍成的面積即曲線下面積(area under curve,AUC)分別為0.77~0.91,0.60~0.83。因此,DASS-21 的抑郁分量表的效標(biāo)效度為“充分(+)”,為高質(zhì)量證據(jù),而DASS-21 的焦慮分量表的效標(biāo)效度為“不充分(-)”,中質(zhì)量證據(jù)。
表6 COSMIN 對效標(biāo)效度評價的質(zhì)量準(zhǔn)則
2.3.4 假設(shè)檢驗效度 COSMIN 對假設(shè)檢驗效度評價的質(zhì)量準(zhǔn)則見表7。Lee 等[3]對DASS-21 抑郁分量表 與Beck 抑 郁 量 表(Beck Depression Inventory,BDI)、醫(yī)院焦慮抑郁量表(Hospital Anxiety and Depression Scale ,HADS)抑郁分量表、正性負性情緒量表(Positive and Negative Affect Schedule,PANAS)負性情緒分量表的相關(guān)性,DASS-21 焦慮分量表與貝克焦慮量表(Beck Anxiety Inventory,BAI)、醫(yī)院焦慮抑郁量表焦慮分量表、正性負性情緒量表負性情緒分量表的相關(guān)性,以及DASS-21 壓力分量表與正性負性情緒量表負性情緒分量表的相關(guān)性進行定量總結(jié),結(jié)果發(fā)現(xiàn),DASS-21 抑郁分量表與BDI(r=0.73)、HADS抑郁分量表(r=0.69)、PANAS 負性情緒分量表(r=0.56),DASS-21 焦慮分量表與BAI(r=0.75)、HADS焦慮分量表(r=0.66)、PANAS 負性情緒分量表(r=0.55),DASS-21 壓 力 分 量 表 與PANAS 負 性 情 緒 分量表(r=0.66),均有較高相關(guān)性。鑒于以上結(jié)果,假設(shè)檢驗效度評價為“充分(+)”,為高質(zhì)量證據(jù)。
5 項研究評估了已知組別效度,對所有包括已診斷為精神病病人在內(nèi)的已知組別效度進行比較,DASS-21 抑郁和焦慮分量表的結(jié)果完全與假設(shè)相一致,DASS-21 壓力分量表的結(jié)果80%都符合假設(shè)。因此,DASS-21 的假設(shè)檢驗效度總體評價為“充分(+)”,為高質(zhì)量證據(jù)。
表7 COSMIN 對假設(shè)檢驗效度評價的質(zhì)量準(zhǔn)則
2.3.5 反應(yīng)度 COSMIN 對效標(biāo)效度評價的質(zhì)量準(zhǔn)則見表8。Lee 等[3]發(fā)現(xiàn),2 項研究報告了DASS-21 的反應(yīng)度,其比較了入院/出院前和出院后病人的DASS-21評分,發(fā)現(xiàn)在出院后病人的DASS-21 抑郁與壓力維度評分有顯著性改變,這與DASS-21 抑郁、壓力分量表的假設(shè)相一致,但考慮到研究存在嚴重的偏倚風(fēng)險(運用t 檢驗分析反應(yīng)度是不恰當(dāng)?shù)模?,故總體評價為“充分(+)”,為低質(zhì)量證據(jù)。焦慮分量表反應(yīng)度的相關(guān)研究由于使用配對t 檢驗導(dǎo)致各個研究之間的結(jié)果不一致,故總體評價為“不充分(-)”,為極低質(zhì)量證據(jù)。
表8 COSMIN 對反應(yīng)度評價的質(zhì)量準(zhǔn)則
此部分包括描述PROMs 的可解釋性和適用性,形成最終推薦意見,并呈現(xiàn)系統(tǒng)評價報告。
3.1 步驟8:描述可解釋性和適用性 可解釋性是指PROMs 的定量分數(shù)(或分數(shù)變化)被賦予定性意義(如臨床意義)的能力。適用性是指PROMs 在限制時間或資金等條件下是否易于使用,如完成PROMs 的時間、PROMs 的花費、PROMs 的內(nèi)容長度及回答的形式與難易度等。Lee 等[3]在系統(tǒng)評價報告的討論部分提及DASS-21 尚未明確臨床臨界值,關(guān)于量表的最佳臨界值需要進一步研究。關(guān)于量表的適用性,描述了量表含有3 個維度、21 個條目,內(nèi)容相對較短,花費時間較少,且DASS-21 可免費獲得,實用性較好??山忉屝院瓦m用性并非PROMs 的測量屬性,但他們是選擇最佳PROMs 的重要考慮因素之一。若有兩項PROMs 的質(zhì)量難分上下,那么建議在選擇時考慮二者的實際適用性(如時間和預(yù)算限制等)。
3.2 步驟9:形成PROMs 推薦建議 針對研究人群與目的,研究者還需要提出在該領(lǐng)域選擇最佳PROMs 的 建 議,COSMIN 建 議 將PROMs 分 為3 類:①A 類PROMs 為內(nèi)容效度“充分”(任何等級證據(jù)),且內(nèi)部一致性充分(至少為低質(zhì)量證據(jù)),被推薦使用,使用此類PROMs 的研究結(jié)果是可信的;②B 類PROMs 為不屬于A 類或C 類的PROMs,被認為具有可應(yīng)用的潛力,但需要進一步的研究來評價其質(zhì)量;③C 類PROMs 為具有高質(zhì)量證據(jù)證明其測量屬性“不充分”的PROMs,不建議使用。Lee 等[3]雖僅對DASS-21這一種PROMs 做了系統(tǒng)評價,沒有對多種PROMs 做出種類劃分,但也需要對DASS-21 做一個推薦級別評價,以便其他研究者與臨床工作者參考使用。注意:若目前只含有B 類PROMs,那么在其他更佳證據(jù)出現(xiàn)前,內(nèi)容效度最好的B 類PROMs 可推薦使用。此外,最終推薦意見中還應(yīng)說明將PROMs 歸于某個類別的原因,并提出對該PROMs 未來測量屬性研究方向的建議。Lee 等[3]在討論部分對DASS-21 未來測量屬性研究給出了自己的建議,如尚未有研究評價DASS-21的測量誤差,有待進一步研究與探討。
3.3 步驟10:報告系統(tǒng)評價 Lee 等[3]報告的系統(tǒng)評價基本包含了COSMIN 所建議的內(nèi)容,如①檢索策略、檢索結(jié)果、篩選過程與流程圖;②納入PROMs 的信息,如PROMs 的名稱、所測構(gòu)念、測量屬性、語言版本、研究對象群體、使用情境、量表或子量表數(shù)量、條目數(shù)量、回答選項、回憶期、可解釋性與適用性;③納入研究人群的信息,如地域、語言、疾病特征、目標(biāo)人群、樣本量、年齡、性別與國籍等;④用結(jié)果總結(jié)表的形式呈現(xiàn)最終推薦意見(包含測量屬性的質(zhì)量評價與證據(jù)質(zhì)量等級),但缺少更詳細的檢索策略以及每項PROMs測量屬性研究的偏倚風(fēng)險評估單,有待進一步補充。
本研究選取2019 年Lee 等[3]根據(jù)COSMIN 方法制作的一篇系統(tǒng)評價,其制作流程基本符合要求,但是過程中的一些細節(jié)與最終系統(tǒng)評價的呈現(xiàn)方面仍有待改進?;诖舜螌嵗庾x,本研究建議:系統(tǒng)評價制作者在制定系統(tǒng)評價前應(yīng)該制定計劃書并進行注冊登記;對COSMIN 方法進行系統(tǒng)學(xué)習(xí)與研究(可參考本系列其他文章);在制作系統(tǒng)評價前明確感興趣的PROMs所測構(gòu)念、目標(biāo)人群、PROMs 類型及其測量屬性4 個要素,并制定恰當(dāng)?shù)奈墨I納入與排除標(biāo)準(zhǔn);接受系統(tǒng)的檢索培訓(xùn),掌握全面的檢索方法,選擇合適的國內(nèi)外數(shù)據(jù)庫與中英文檢索式,學(xué)會恰當(dāng)?shù)乩脵z索過濾器進行文獻查找;遵循雙人獨立篩選文獻的原則,無法達成共識時征詢第三方專家意見,采用追溯參考文獻及專家咨詢的方式盡可能全面地獲取相關(guān)研究。評價PROMs 測量屬性時,需遵循COSMIN 偏倚風(fēng)險清單、質(zhì)量準(zhǔn)則及改良版GRADE 方法,逐步且恰當(dāng)?shù)剡M行評價,在系統(tǒng)評價最終呈現(xiàn)時亦要有完整且全面的體現(xiàn);當(dāng)研究間不一致、結(jié)果無法解釋時,可采取亞組分析的方法進行討論。在評價PROMs 各測量屬性后,需要描述PROMs 的可解釋性與適用性,并形成最終推薦意見,為最佳PROMs 的選擇提供參考信息。最后,在做系統(tǒng)評價的呈現(xiàn)與報告時,包含的內(nèi)容要全面、準(zhǔn)確,圖表要完整無誤、清晰直觀。
應(yīng)用COSMIN 方法制作系統(tǒng)評價的整個過程科學(xué)且流暢,能夠全面、系統(tǒng)地評價PROMs 的每個測量屬性與整體質(zhì)量。但是制作過程耗時較長,評價條目較多,工作量較大,對評審者的要求也較高。此外,COSMIN 方法也仍有待補充與完善。